推文详情

@normanzxy@alive.bar
DeepSeek有没有从OpenAI那里获取训练数据(所谓“蒸馏”),不是意气之争,而是一个严肃的,必须搞清楚的科学问题。因为,这个新技术路线的价值,就在于(声称)可以用1/10的算力达到同样的性能。所以是不是真的从头到尾总共只用了那么多算力,就成了关键问题。不然,它的价值就会大打折扣。be like你声称培育了一种新的转基因猪,可以用1/10的饲料产出同样多的肉,可是别人一看,你的饲料本身喂的就是肉,那你这猪有啥价值呢?小保方晴子还记得吧?她的问题并不在于做不做得出干细胞,而在于她所声称的特别简单高效的制备方式(弱酸性环境使细胞恢复到未分化状态),事后被证明是不成立的。说起来,就算你恨日本,谁不希望小保方晴子是对的呢?因为如果她的方法被证明有效,干细胞可以被如此容易地制备,从2014年至今,能解决多少医学上的困难问题啊。同样的道理,我也非常希望DeepSeek的数据源没问题,因为果真如此,AI发展就能摆脱现在的算力限制,这是何等性感的想象?但,事实就是事实,等等看。

@shqm2@mastodon.social
@normanzxy 我能相信方滨兴能助纣为虐搞出长城防火墙,但我不相信华为、中芯多次的‘’遥遥领先‘’。
这次,还有多年前的“龙芯”之类,也一样。
在需要鼓励创新氛围、高额投入、基础性研究、国际分工配合……的前提性背景下,再玩草船借箭、自力更生以弯道超车,是妄想。
