科技入侵现代 第437节
在方案的最终结果中,这林燃手握阿波罗科技超过70%的投票权,确保了对企业的绝对控制。
林燃看完后点了点头:“就按照这个去办吧,我没有太多意见。”
燕京方面觉得林燃在意,实际上林燃压根就不在意。
因为控制权到底在不在他手上,和规定没太大关系,和燕京方面意愿有关系。
燕京方面愿意,那就算他只有10%的投票权,企业的控制权也在他手上,燕京方面不愿意,哪怕他有90%的投票权,他也决定不了什么。
就像杰克马在申海外滩说错话,立马在简中互联网销声匿迹,对阿里和蚂蚁的控制权直线下滑,只见职业经理人,不见杰克马的声音。
这还是民营企业,像阿波罗科技这种类型的企业就更不用多说了。
林燃很清楚,只要他还在,那么公司的控制权会一直牢牢掌握在他手上,他不在之后,留给后代又没有这个能力,那是祸非福。
在和宋南平短暂聊过之后,他就起身出门,前往会议室,暑假已经开始,交大林燃数学班的同学们期末考试已经结束,大家都已经到位,准备开始进行暑假实习了。
是的,无一例外,这60名同学全部都申请了前往深红实习。
目前深红和阿波罗科技共享办公区域,毕竟深红的员工数就只剩下两百多号人,这点人连一层楼都占不到,压根就不用单独再弄个办公区域。
外界在得知林燃数学班的同学可以直接跑到深红实习,而且没有门槛,全员都能去,那是彻底疯狂了。
今年的高考甚至有省状元对外宣称,自己要报申海交大。
申海交大今年甚至还捞了两个IMO金牌,要知道这些原来可只会去燕大。
这可把同城老兄弟复旦给酸死了,同济不酸,同济能去阿波罗科技,大家高度对口,本来同济也不指望能当top3。
“大家好,我看到大家都很兴奋啊,对于能来深红实习。
我想跟各位说,你们来深红实习,不会像在其他互联网机构那样,做一些打杂的工作,我会交给各位一个完整的项目,由深红的员工,你们看到的这十位深红员工配合大家。”
林燃指了指会议室右边坐着的十名员工,长相明显要更加成熟一些,但也成熟不了多少。
搞人工智能的这些工程师都很年轻。
“由他们带着各位,做一个纯粹基于文科领域的人工智能大模型。
需要涵盖的内容包括模拟社会学场景、分析心理学实验数据、政治政策评估、经济模型预测等等,把其限制在文科领域,需要有足够的专业度,模型在特定任务上能够达到人类专家的水平。
这个模型我将他命名为群星闪耀。”
啊?这还真是大家都没有想到的课题。
这类需求在国外的话,你还能看到,但是在国内,这尼玛也太稀缺了,特定领域,仅限于文科领域的大模型,能派上什么用场?
大家实在是想不到。
对林燃而言,他需要的就是这种,之所以命名为群星闪耀,象征着这个模型未来放在月球背面的时候,能够照亮人类群星。
这么说,当1971年阿美莉卡试图以一己之力脱离布雷顿森林协定的时候,人类经济学家都不知道这意味着什么的时候,群星闪耀能够给予人类指引。
当苏俄陷入困境,在经济上艰难困苦,石油高企过去的时候,有群星闪耀能够告诉他们,到底犯了什么错。
当华国,华国没啥问题。
总之就是群星闪耀。
“我可以简单和大家说一下,你们的工作可能涵盖哪些内容,如果我来做,我会从什么角度着手。
最重要的其实是数据,数据需要聚焦于高质量、特定领域的文本,像哲学的伦理文本,形而上学的著作,社会学的理论研究和实地调查报告,政治学的政策文件、数据文本之类的。
你要找这些,总得知道到哪里去找论文索引,知道到哪里去找开放资源,如果这些不够,要购买的话,到领域期刊去收集数据。
开放的数据收集完,如果需要,再联系综合部去找领域期刊收购他们完整数据库的使用权。
我预计需要确保至少500亿的tokens,来确保专业深度。
确定数据之后要对数据进行清洗吧,要去除噪声重复以及具有偏见的内容。
一些文本也许很热门,有超多引用或者下载,但实际上内容并无价值,这也需要大家来判断。
这是数据阶段要做的工作,在模型开发和训练阶段,你们可以直接用深红来训练,不需要从头开发,直接让工作人员协助你们基于现有模型进行训练。
如果训练结果不满意,需要对模型调整,那么你们可以先自己试试看,有什么不懂的,你们发邮件给我,我安排时间来为大家提出解答。
我的目的是,希望大家能够开放出一个,足够中立客观专业的模型,外界在使用的时候,丢任何一个社会议题给它,它都能给出足够专业的解答。
如果足够好的话,我会考虑把它卖给微博,成为微博社会议题的独立客观第三方意见。
所以,各位,你们的工作很有意义。”
林燃内心实际上在想,各位,不是很有意义,是非常有意义,它可能会改变整个时代的走势,改变整个世界。
至于为什么不自己做?
因为林燃在这个时空要呆很长一段时间,他不想专门花时间来做这个,丢给学生,在深红现有资源下,当成是一个练手的课题恰好合适。
又不是这个暑假就要做完,会当成一个课题,一直推进,这届做不完,新一批学生进来之后继续做,本身交大的生源一年比一年好,林燃数学班的门槛也一年比一年高。
他要在这呆七年左右,时间绰绰有余。
“大家通过这个课题,能够接触到几乎所有的人工智能大模型需要做的工作,我相信这对各位无论是现在还是未来,都会相当有帮助。”
最后群星闪耀上线后,在1960时空引发的影响暂且不表,在微博上,属于是直接炸粪坑了,大把博主开始指责这款大模型既不客观,也不中立,更不是什么所谓第三方,完全是林燃个人意志的体现。
哪怕参与到其中的同学们,出来发文解释,也连带着被群起攻击。
这是林燃也好,在座同学们也好,都始料未及的。
第355章 也许常温超导才是常态
“教授,我有一个问题。”
林燃在说完后,坐在靠后位置的一位同学高高把手举起,林燃点头后,他起身说道。
“你说。
在你说之前,我先给大家介绍一下,这是来自水木姚班的赵同学.
这次我们的暑期实习,除了对大家开放外,还有另外少数名额,开放给了其他高校的同学。”
林燃说道。
赵同学确实是水木的,但不是说水木的就一定得放进来实习,而是有神仙来递话,希望能安排来实习。
关系到位的基本上都放进来了。
只是实习而已,与人方便,未来也是自己方便。
林燃没有什么清高的想法,无论是国内还是国外,靠关系这点都在所难免,这是人决定的。
在人类社会里,你能做到的就只有与光同尘。
“教授,是这样,您要做的这件事当然很有意义。
可问题在于,你这是想争夺舆论场的话语权吗?
这是一件很危险的事情,我觉得您如果真的要这么做,最好还是和燕京方面的有关机构进行充分沟通,征得他们同意后再做。
我举一个很简单的例子,可以让您更直白理解这件事。
之前百度有百度快照,大家可以根据百度快照,把过去一些已经消亡的网站给找到。
我相信百度快照这个功能依然存在,但已经不对大众开放了。
很大一部分原因在于,不想让大家搞合订本。
同样一件事,五年前和五年后,同样是出自官方的报道,合订本这种玩意会严重影响到公信力。
为什么五年前和五年后不一致,如果是过去有问题,那么过去做决定的人要不要负责?如果是现在有问题,那就太可怕了。
这个时间跨度,可能不是五年,可能是十年甚至更久,而每一个时间点,你如果搞合订本,会发现对同一件事的宣传口径一直在变。
这是为什么?以及搞合订本想干嘛?想追溯过往吗?想追谁的责任?”
这里最有意思的就是大和尚,2015年的调查报告显示他没问题,别人的指控全是假的,全部都不属实。
10年后公开的问题和十年前有区别吗?没有。
那这十年间,口径为什么会变,过去不是说没有吗?那现在又变成有?
让你搞合订本,更糟糕的在于:2015年关于大和尚的官方调查报告有问题,存在伪造现象,那么后续的每一份报告都要被质疑的眼光凝视。
这才是赛维坦不能接受之重。
“教授,这是我的担忧。”赵同学表情真挚诚恳:“不要试图成为舆论场的坐标。”
林燃思索片刻后问道:“赵同学,我要做的只是人文社科领域的大模型,它不涉及到对你所说的那些数据的收集。
只是从理论层面,给用户提供一个基于专业视角的思考。
不是合订本,更不是什么坐标,现在的大模型也能做到这点,我只是想要更进一步,做一个专业集成度更高的模型。”
赵同学苦笑道:“教授,我当然知道您是好心,没有任何恶意,只是从研究层面去做这件事。
也是为了给我们一个合适的练手课题。
但问题是,被误解是表达者的宿命,您做了这个东西,放到互联网上就是要面临来自各方的舆论压力,有的人会把它当成是剑。
您控制不了这把剑指着的方向。
教授,您应该知道基尼指数是什么吧?
统计局偶尔会公布基尼指数,然后西南财大之前也做过基尼指数的统计,二者相差极大。
(来自官方的基尼指数情况)
西南财大做这个统计的时候,我认为应该也只是出于学术考虑,一个社会学课题而已,我们明明做的是0.61、0.62,官方给的是0.46左右,这个数据相差是如此之大。
中性的学术研究,公开后,它就不再受控制了,它会被解读出各种各样的意思。
甚至成为攻讦教授您本人的一把利器,挑拨您和燕京方面关系最好用的工具。
教授,我给的建议是,您可以做,这个模型当然很有意义,也可以对外公开,您就把责任推给我们,您给的课题,然后我们做出来的东西。
在和燕京方面沟通后,作为一个类似学术成果展示的东西放到社交媒体上,降低外界的期望,避免成为一把度量尺。
教授,您的地位太高、名望太重,以您或者深红的名义,整个事情很容易就失控,如果以学生作品的名义,则恰到好处的。
学生嘛,犯错很正常。”
林燃点了点头:“好,我知道了,我会好好考虑你的建议的。”
该项目的负责人也姓赵,成功留下来的赵松下在林燃走之后,走上台前,和大家简单的做自我介绍。
上一篇:人在崩铁几千年,游戏开服了?
下一篇:重生者太密集?我带国家队下场
