地承认:“是,阿得拉的研究价值确实不如曲唑酮。但是,我想顺带验证一个新算法,从根源上解决数据稀缺性的问题。”

“你是想同时完成一篇方法学论文?用这个数据集来做验证?”

梁思宇马上明白了她的意思,她这是想一石二鸟,用一个数据集完成双重目的,发表两篇不同性质的论文。

不过,他也有不解之处:“等等,让我想想,RNN的迁移学习在其他药物上并不一定适应吧?这个算法不具有普适性吧?方法创新在哪里?”

许瑷达摇摇头:“不是你想的这种,是一种更激进的方法改进。我是想用GANs(对抗网络)训练一个肌电数据的生成器。”

她放慢语速,“我想证明,少量真实数据加大量生成数据,就能训练出有效的算法。”

“什么?!”梁思宇目瞪口呆。

他花了十几秒钟来消化这句话,眉头慢慢皱紧。

不,这不是激进,这简直是颠覆。照他看来,这完全不符合实证研究的基本原则。

许瑷达试着解释,GANs(对抗网络)需要训练两个互为对手的AI模型。

一种是生成器,基于普通的sEMG信号生成受阿得拉影响的信号,一种是判别器,来分辨这个信号到底是伪造器生成的还是真实信号。

两个模型互相攻防,迭代多次后,生成器产生的数据达到“以假乱真”的水平——判别器很难鉴定其真伪。

这时候,就可以用少量真实数据加大量生成数据来训练算法,从根源上解决特殊参与者训练数据不足、数据收集困难的问题。

“思路上我明白了,”梁思宇非常犹豫,“可是,这有点像一种数字游戏。”

“用虚拟生成数据来训练运动控制算法?怎么确保它们和真实数据一致?”

他点破自己的担忧:“判别器不能分辨,也许不是虚拟数据足够仿真,而是你的判别器不够聪明呢?”

许瑷达点头:“所以,我们还是要招募阿得拉的使用者,收集真实数据。你就当我的GANs算法在搭便车,做不出来也没损失,对不对?”

“到时候,如果用它生成的虚拟数据和真实数据训练出来的算法一样好,你是不是可以承认,我的方法是有效的?”

梁思宇叹了口气,听她这意思,是准备私下完成,才向导师汇报,可见她自己也知道成功率不高。

这是刚发表一年的新算法,万一算法本身有问题呢?况且,她完成了算法,也得投稿啊,审稿人那一关呢?他觉得这个做法真的很冒险。

他劝道:“Ada,你也得想想投稿的问题,审稿人恐怕会觉得这方法不够严谨。起码,医学期刊上,据我所知,没有人会接受虚拟数据。”

她有些不舒服,微微提高了音量:“那是你们既傲慢,又无知,不肯看看其他领域的进步。”

她怎么这么倔呢?他扶着额头:“你就准备这么回复审稿人?”

“行了行了,我就私下说说。”她也承认自己不过是逞口舌之快。

其实她不准备投医学期刊,这个适合nature、PNAS这种综合型期刊。不过,涉及药物和医学,还是可能遇到医学方向的审稿人。

她眼珠一转,神秘兮兮地笑了,像只小狐狸。她干脆绕过餐桌,坐到他膝上。

“Ned,你来想想怎么应付审稿人,好不好?”她抱住他脖子,轻轻摇晃。

“你想得美!”梁思宇无奈地扶住她的腰,让她坐更稳。这个小坏蛋,老喜欢把这种解释类的写作任务扔给他。

他-->>

章节列表 转码阅读中,不进行内容存储和复制