核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
上一篇 : 「香港四大才子」之一蔡澜去世,你对他有哪些了解?如何评价他的成就?
下一篇 : 雷军为什么不愿意用性价比打法进军NAS?
男子聚餐喝酒后冻死街头,法院表示「4位同事无过错」,如何评价此事?共同饮酒人是否需要承担责任?...
为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到?...
macOS下有哪些作为开发人员推荐安装的软件?...
你会从mac转向Windows吗?...