核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
上一篇 : 古代世界各国如何神化在世的人?
下一篇 : 如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
高考结束了,有大佬可以指点一下吗?:想要自学编程,有没有什么好的网站和学习***推荐?...
做个web服务器,gin框架和go-zero怎么选?...
有没有系统介绍 Visual Studio 使用和技巧的书籍?...
为什么人们通常不相信漂亮女孩是一个工程师?...