手机浏览器扫描二维码访问
孟繁岐的这番话,听起来让人觉得不是那么舒服。
言下之意,给人一种华国AI技术就是不如国外的感觉。
这是李彦弘不大喜欢的,毕竟他这么早就关注AI技术,就是为了研发最前沿最先进的技术。
孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量发表的AI论文所迷惑。
觉得在这个新崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。
虽然AlphaGO震惊了世人,但毕竟有些华而不实。
直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。
实际上,并非是技术手段和算法层面上相差太远。
更多的还是因为优质数据的数量不足。
白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。
很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。
文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。
可见即便不是全部,文心一言这个所谓的专注中文的超级大模型,也在相当程度上借助了英文基础的模型权重和技术。
究竟为何要这么做,说到底还是基础不够扎实牢靠。
整理数据,清洗数据,给数据打上高质量的标签。
这些都是脏活累活,见效慢的工作。
把别人公开的数据拿过来跑一跑训一训,多么方便快捷?
以国内996大厂的内卷风气,很难容下长回报周期的基础建设。
早些时候看看不出区别,只觉得国内大厂频繁在XX榜单上露面,刷榜,又是超过这个,又是超过那个。
直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。
“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。
“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”
“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的。。。。”
此消彼长之下,差了多少珍贵的数据啊。。。
年轻貌美的科研大佬,一朝穿越成了父不祥,娘又疯的野种,家里穷得响铛铛,还有不明势力打压?她撸起袖子智斗极品和恶势力,凭借着专业知识在古代发家致富,一不小心成了各路大佬,身份尊贵,无人能及!只是,某人...
别人可以拥有一辆真正的赛车,余笙只能到二手车行租普通摩托车。别人赛车只为好玩刺激,余笙必须靠赛车挣钱一辆邪恶战车,碾压所有对手,敌人跪着求饶,女神躺着求抱,飞奔吧,车轮滚滚向前,在人生的征途上狂飙...
正统修仙,成长流,无CP仙人抚我顶,结发受长生。一介孤女江月白,翻山九重上青云,只为觅得仙人路,放浪天地踏云霄。修仙之路,逆天而行。与天争,与地争,与人争,与己争。师姐日诵十卷经,她便读书到天明。...
反派和炮灰是没有好下场的!时空管理局上班的新人裴彦第一次做任务就接到了一个大活儿,改造人渣让他们过上幸福生活。第一个世界啃老的学霸,谁能想到学生时期辉煌的学霸,工作后居然失去社交能力回家啃老?裴彦...
重回学生时代,康妙玟发现自己的脑子升级换代了,特灵光,全家喜大普奔。上名校,搞竞赛,学音乐,开画展,群众纷纷表示这不可能!背后一定有推手!有枪手!康妙玟谦虚的表示轻轻松松,不值一提,就是这么自信...
某人一开始是平平无奇的防守型后腰。后来他凑巧学了点组织,又学了点持球推进,再学了点任意球。于是足坛热闹起来了。卡卡和C罗很喜欢他,因为他颜值高说话又好听,更重要的是他能帮他俩擦好屁股,让他们在前场能安心进攻。梅西对他又爱又恨,因为他一打巴萨就来劲,但又老是勾引梅西和他去踢兄弟足球所有八号位球员都喜欢和他共事,他的保护无处不在,抗压能力更是足坛第一。他是中卫身前的超级屏障,是中场球员们的最好搭档,是前锋身后的坚实护盾。哈维阿隆索是他的老师,穆里尼奥是他的BOSS,博一亿更是他的小弟。每当有记者问起他是如何成长的,他都会告诉对方训练的时候要狠狠努力!这不是他在凡尔赛。因为他真是一步一步肝到了足坛大结局!这一切,还得从一个天生非酋的故事开始说起...