首页 > 都市情感 > 学霸的模拟器系统

学霸的模拟器系统 第113节

  他的声音因为激动而拔高,在空旷的办公室里回响。

  “我就是要用最极端的实验条件,去摧毁他们那个所谓‘优美’理论的根基!我要告诉全世界,这个领域,最终还是由我们做实验的人说了算!”

  “可是教授,我们在文章中没有披露故意引入杂质的事实,这有违学术道德……”

  大卫还想劝说。

  “闭嘴!”

  乌萨尔粗暴地打断了他,“制备过程中都会有杂质,这不是事实吗?我们的杂质只是比正常情况高了一些罢了,我们不说,谁会知道这是人为添加的?

  “你要是觉得不道德,可以离开我的课题组!”

  大卫的脸上闪过一丝挣扎,但最终还是沉默了。

  乌萨尔教授看着自己学生那副样子,不屑地哼了一声。

  他径直坐回电脑前,打开了一个文档。

  文档的标题,措辞极其尖锐,充满了煽动性——

  《On the Fragility of Theoretically Predicted Quantum Anomalous Hall Effect in Graphene》

  (《论石墨烯中理论预言的量子反常霍尔效应之脆弱性》)

  乌萨尔在文章的“致谢”部分,特意加了一句:“感谢韩至渊教授课题组发表在PRL上的‘启发性’工作。”

  然后,他没有丝毫犹豫,将这篇充满了火药味的文章,连同他们那些看似“推翻”了原理论的实验数据,直接上传到了预印本网站arXiv。

  ……

  金陵大学,集训队宿舍。

  林允宁告别里希特教授,婉拒了对方共进晚餐的邀请,回到了自己的座位上。

  他在Google Scholar的搜索框里,好奇地敲下了“Neural Network”两个单词。

  屏幕上,立刻跳出了密密麻麻的相关论文。

  他随意点开一篇综述,快速地浏览了一遍,立刻被里面的内容所吸引了。

  一个简单的神经网络,只是通过学习大量的图片,便最终能够准确地区分出‘猫’和‘狗’,甚至还能识别各种手写字母和数字。

  林允宁靠在椅背上,若有所思。

  显然,神经网络是个很强大的工具,但里希特教授的RTN问题,是一个时域信号的难题,单纯用神经网络来处理,不经过信号转换,很难去识别统计规律。

  他“识别模式”的思路没错,只是算法模型的选择上,还需要继续考虑。

  林允宁叹了口气,刚要关闭综述页面,却忽然想起来一件事。

  材料系高翔的那个高熵合金的“三色灯”项目,不也是一个典型的模式识别问题吗?

  从一堆复杂的XRD数据和工艺参数中,自动判断出样品的“好”、“中”、“差”。

  逻辑上来说,跟识别猫和狗并没有本质的区别。

  一个新的念头,在他脑中清晰地浮现出来。

  ……

第104章 物理信息神经网络(求收藏求追读求月票)

  有了新的想法,林允宁立刻合上笔记本,抓起桌上的集训队图书卡,走向金陵大学图书馆。

  高翔曾经跟他说过,在制备非平衡磁控溅射的多组分金属薄膜时,想找到一种方法,只用少量的XRD数据和几个简单的电学指标,就能快速判断样品是否落在了想要的目标相区。

  当时,林允宁给了他一个用贝叶斯框架搭建的,用红、黄、绿三色灯判断样品相区的构思。

  只是,他还没来得及实现,就被雅努斯计划吸引了全部注意力,将这个课题搁置了。

  如今看来,用神经网络来处理这个问题,可能比贝叶斯模型更高效。

  “三色灯”项目,本质上是一个分类问题,与识别猫狗并无二致。

  而里希特教授的随机电报噪声(RTN),则是一个更复杂的时域信号识别问题。

  两者有一定的共通之处,也许能用相似的方法论来解决。

  林允宁决定先从简单一些的“三色灯”项目开始做起,积累了经验,再推广到RTN问题中。

  雅努斯计划的实验验证部分,他目前毫无思路,只能先做其他课题,慢慢寻找灵感。

  图书馆,计算机科学阅览区。

  林允宁在高大的书架间穿行,最终抽出了两本厚重的英文影印书:

  克里斯托弗·毕晓普的《模式识别与机器学习》和Haykin的《神经网络(第二版)》。

  回到宿舍,他快速翻阅着那两本书。

  感知机、反向传播、梯度下降……这些在十几年后烂大街的概念,在2005年的此刻,对绝大多数人而言还如同天书。

  但对林允宁来说,这套逻辑清晰的数学框架并不难理解。

  【检测到你已完成对《模式识别与机器学习》的首次通读,该知识模块已成功收录!】

  【新知识模块:机器学习 LV.1概念认知】

  林允宁没有犹豫,直接调动了系统。

  【注入模拟时长:200小时!】

  【指定模块:机器学习 LV.1 -> LV.2范式掌握!】

  当模拟结束,林允宁睁开眼时,一个基础的神经网络框架已经在他脑中清晰成型。

  他立刻打开电脑,开始用Python搭建一个最简单的三层全连接神经网络,加入到了Aether中,命名为Aether_ML_NN。

  在【模拟科研】的帮助下,他很快完成了新模块的编写。

  吃过午饭,他带着初步完成的Aether_ML_NN模块,来到了材料学院高翔的实验室。

  实验室里还是一如既往,真空泵低沉地嗡鸣。

  高翔的办公桌上还摆着两个泡面桶。

  他看到林允宁,布满血丝的眼睛里亮起一丝期待。

  “林师弟,你那边……”

  “模型做好了,可以试试。”

  林允宁将自己的笔记本电脑连接到高翔的工作站上,调出了一个简洁的界面,“我已经把你发给我的实验数据和对应的工艺参数,还有你对样品质量的‘好’、‘中’、‘差’的标记,全部导入了Aether进行训练。

  “我现在需要更多的数据,进行交叉验证。”

  高翔点了点头,立刻行动起来,将最近一个月的数据——十几份样品的XRD图谱和对应的溅射功率、气压、时间等参数,输入这个新模型。

  “开始交叉验证。”

  林允宁点下鼠标,进度条开始缓慢移动。

  十分钟后,屏幕上弹出了一个分类准确率。

  53.2%。

  这个准确率,和闭着眼睛瞎猜也没什么区别。

  实验室里一片安静。

  高翔脸上的期待迅速褪去,最终化为一声无奈的叹息。

  他摘下眼镜,用力揉了揉眉心,声音里带着实验人特有的疲惫:

  “唉,我就知道没这么简单。机器学习这东西,在咱们这种小样本、高维度的材料科学里,可能真的不适用。”

  他并没有抱怨,失败是科研的常态,他早已习惯。

  林允宁却没说话,只是盯着屏幕上的混淆矩阵。

  那上面显示,模型能轻易地区分出“好”和“差”的样品,却在“中等”和“良好”这两个最关键的区间,错得一塌糊涂。

  为什么总在这两个区间犯错?

  林允宁修长的手指轻轻敲击着桌面,很快有了结论。

  从XRD图谱上看,这两个区间区别不大,峰型和峰位确实很像。

  但神经网络只看到了相似性,却不知道实现两者的工艺参数,比如功率和气压,在物理意义上天差地别。

  换句话说,问题不出在神经网络本身,而在于他给的“信息”不够。

  “高师兄,”

  林允愈抬起头,“我们得教它物理。”

  “教它物理?”

  高翔没听懂。

  “对。它现在只会‘看’,不会‘理解’。”

  林允宁指着屏幕,“我们得把溅射功率、气压这些工艺参数,不是作为普通数据,而是作为强约束的‘物理规则’,强行写进模型里。让它知道,功率提高1瓦,和气压改变1帕,对最终晶体结构的影响是完全不同的。”

  一个全新的混合模型框架——“物理信息神经网络”(PINN),在他脑中成型。

  【注入模拟时长:50小时!】

  【模拟科研启动……】

  【第15小时,你正在重构算法。你尝试将描述原子扩散和成核过程的Arrhenius方程,作为一个惩罚项,加入到神经网络的损失函数中。任何不符合该物理规律的参数预测,都会受到巨大惩罚。】

  【第45小时你意识到,你正在创造一种全新的模型:不再是让机器去拟合物理,而是用物理去约束机器。】

  现实中,林允宁的手指在键盘上翻飞。

  一个小时后,Aether_ML_PINN_v1.0诞生了。

  他重新导入数据,点击了“开始训练”。

  这一次,模型不仅要拟合数据,还要满足物理规律的约束。

  训练过程慢了很多,一直快到晚上吃饭的时候,才终于完成。

  训练完成,高翔再次导入了那份测试数据。

首节 上一节 113/509下一节 尾节 目录txt下载

上一篇:影视:开局从同过窗开始进步!

下一篇:返回列表

推荐阅读