最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
上一篇 : 你最真实(很少吐露)的择偶标准是什么?
下一篇 : 男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
求大神解答,为什么大家都不喜欢用docker?...
我国的军工能力可以实现一天5000枚火箭弹连着炸三个月吗?...
iOS 26 的新设计被吐槽丑,苹果在设计更新时考虑了哪些因素?你对这一设计都有哪些评价?...
现在的年轻人喜欢穿连裤袜吗?...