今天看到vLLM的朋友圈发布了DeepSeek R1的PP支持,立刻开始我的捣鼓之旅,假如我训练的超大MoE上线了,也得做好技术准备工作 ...
情况说明一、train_conf.max_epoch如果为50不会报错,但是修改为其他数字就会报错。 并且train_conf.max_epoch为50虽然没有报错。感觉有点奇怪,启动以后,很快就跑完了,我这里只用了4条数据测试,但换成2w条数据,也是是4、5分钟就完了。 并且和官网给的日志不太一样。官网的日志输出是这样的, ...
Traceback (most recent call last): File "/root/miniconda3/lib/python3.10/site-packages/gradio/routes.py", line 442, in run_predict output = await app.get_blocks ...