最早小说 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

至于为什么林灰不将生成式对抗网络搬出来?

林灰不想给外界其余的学术人员一种割裂感。

就像林灰在过往游戏开发(搬运)时不想给游戏玩家一种割裂感一样。

虽然林灰现在已经有了一定的将生成式对抗网络的推出逻辑基础。

(林灰此前搞得生成式文本摘要里面涉及到的生成式模型,而从伊芙·卡莉那收购来的专利中又涉及到类判别式模型,而生成式对抗网络其组成正是包含有生成式网路和判别式网路……)

但如果林灰贸然搞出生成式对抗网路依旧不是很好。

毕竟生成式对抗网络就应用层面来说和林灰现在一向搞得自然语言处理这一学术领域其实关系不太大。

在这种情况下,林灰莫名其妙推出一个和自然语言处理几乎没啥关系的模型算怎么回事呢?

虽然学术方面无心插柳柳成荫的例子很多,很多学术成果最开始问世的时候目的往往是跑偏的。

但林灰内心信奉的原则是注定了林灰不大可能打破此前延续的惯例。

无论是游戏开发还是学术进展上,林灰都不想给别人一种割裂感。

而且,科技树还是按顺序点比较好。

虽然说作为挂比不按顺序点科技树也可以。

但在多元化的社会下不按规矩办事往往就意味着风险。

乱点科技树,自己的科技逻辑链没形成。

潜在对手却形成了相应的发展脉络。

那么科技成果很有可能被对手所窃取。

这是林灰所不愿意看到的。

现在在林灰看来学术方面他所要做的依然是深耕自然语言处理。

深耕生成式文本摘要。

通过不断的深耕,从自然语言处理这一领域找到破局点

或者说点亮相邻于林灰已点亮科技成果的科技树分支才是最好的。

(林灰倒也不着急,即便是一时之间未找到合适的破局点其实也关系不大。

起码是一个月林灰还是不需要太担心的。

毕竟就生成式文本摘要这方面取得的“突破性进展(成功的搬运)”林灰最起码也能“混”一个硕士学位。

而这也是要林灰消化一段时间了。

其实林灰原本的估计更加乐观。

林灰原本是觉得将生成式文本摘要这个方向的论文搞清楚,就差不多能博士了。

不过通过最近跟伊芙·卡莉的交流,林灰觉得是他过于乐观了。

就像诺奖级成果不一定真的能获得诺奖一样。

就算林灰在生成式文本摘要方面鼓捣出的东西对于这个时空能称得上是博士级甚至更高级别的成果。

但想藉此一步到位获得博士毕业论文也是很有难度的。

毕竟此前林灰搞得学术内容其主要呈现形式都是围绕着生成式文本摘要这样一个算法专利的。

这个时空西方对于专利形式的学术成果更倾向于将之视作偏向于实践的东西,亦即工程上的成果。

而仅仅依靠工程方面的成果想要一步到位弄到博士方面的成果是很麻烦的。

虽然涉及到生成式文本摘要在学术上的收益这个稍微低于林灰的预期,不过问题不大。

林灰觉得学术上步子太大也不完全是好事情。)

既然短时间不搬运生成式对抗网路。

那刚才关于生成式对抗网路的思考岂不是等同于白白浪费脑细胞?

当然不是。

很多时候思维大概就是在一些漫不经心的思考中获得新的启发的。

关于生成式对抗网路这方面的思考,林灰突然意识到他还有一笔巨额的隐形财富。

那就是前世的人工标注数据。

虽然没太认真翻看前世一同携带来的信息。

但人工标注的数据林灰不可能是没有的。

尤其是前世那些企业级硬盘里面绝对不可能没有人工标注数据。

就算没啥图像的人工标注,涉及到一些文本的人工标注,绝对是不可能少了的。

毕竟这种东西相当实用,而且文本标注其实也不是很占地方。

要知道涉及到神经网路学习训练或者说深度学习训练在模型构建的时候可是需要大量的人工标注数据的。

尤其是监督学习和半监督学习更是需要大量的人工标注数据。

通常一个模型在架构的时候需要很多的人工标注的数据。

在调整的时候也需要很多的人工标注数据。

举这样一个例子:

在图象识别里面,经常我们可能需要上百万的人工标注的数据,

在语音识别里面,我们可能需要成千上万小时的人工标注的数据。

涉及到机器翻译更是需要数千万语句标注数据。

说实话作为一个来自前世往后几年的技术人员。

此前涉及到人工标注数据的价值林灰还真没太当回事。

但现在看来,这玩意的价值此前明显被林灰忽视了。

林灰记得在前世2017年看到的一组数据说得是涉及到人工翻译的话。

一个单词的费用差不多是5—10美分之间,一个句子平均长度差不多是30个单词。

如果需要标注一千万个双语句对,也就是我们需要找专家翻译一千万句话,这个标注的费用差不多是2200万美元。

可以看到数据标注的费用是非常非常高的。

而这仅仅是2017年的数据标注成本。

在现在的话标注成本岂不是意味着更高的数据标注费用?

要知道现在几乎不怎么注重无监督学习。

在无监督学习方面更是几乎没啥可堪一用的模型。

在主流的机器学习依旧是靠监督学习和半监督学习。

而举凡是监督学习和半监督学习基本就离不开人工标注的数据。

以这个角度来衡量的话林灰所拥有的一大批现成的人工标注数据岂不是一笔巨额的隐形财富?

如果说在前世2017年,1000万条双语数据标注就要耗资两千多万美元。

那么在机器学习整体比较滞后的这个时空的2014年。

同样的1000万条双语数据标注需要多少钱呢?

林灰觉得1000万条双语标注数据怎么着也得要个两三亿美元啊。

“两三亿美元”这个数据似乎有点吓人。

但其实也不夸张。

喜欢穿越:2014请大家收藏:(www.xinzz.org)穿越:2014最早小说更新速度全网最快。

最早小说推荐阅读: 末世:开局一头基多拉重生圣尊傲娇校花爱上我野性之心重生资本大亨我考哭了百万学生!娱乐:开局就和丫丫结婚校园超神学生从废土开始模拟城市女神的超级鳌胥林阳萧阳叶云舒超级王者全能侍卫穿越八年才出道我的美女大小姐玩游戏玩成大佬我的秘书是狐妖拜见猫神大人都市纵横,从修改旁白开始一人之下之龙血炽腾一个在赎罪的主播我的地头儿我做主从签到获得商业大楼开始求求你们别再说了大国重工至尊战神全文免费阅读我的冷艳总裁老婆人狐恋护妻霸婿私生子我震惊了全世界女总裁的神级保镖最高使命我在英伦当贵族华娱之流量影帝超时空评测无心法师:从挖出岳绮罗开始我去末世修个仙血海枭雄全职艺术家荒野求生之不小心建了一个超一线文艺生活我给老婆花钱就十倍返利国王的穿越之门从零开始竞选总统重生野性时代好莱坞之路我的极品白富美从美食主播到国民偶像华夏大宗师先婚厚爱
最早小说搜藏榜: 系统让我捡破烂从全能急诊科医生开始神豪:从百倍返利开始基建:开局给珠峰修电梯重生80:从收破烂开始!神豪:我能百倍返现我爸二婚送了我五个姐姐娱乐:从主持人大赛开始四合院之好好活着从情满四合院开始穿越重生之大收藏家灵气复苏:开局神级武魂娱乐:开局渣了杨老板从港片开始当幕后大佬从代工厂到科技霸主神话复苏:这个神明我认识重生过去的逍遥人生我的细胞变异了中医许阳黄金渔场我每周随机一个新职业神豪:开局购买力增幅百倍我被困在同一天一千年娱乐:开局一首海阔天空娱乐:开局喜当爹!高考结束成百亿神豪我在英伦当贵族高考以后,我才重生全球高武重生过去震八方从网络神豪开始神豪:开局骗了女主播!每168小时获得一个异能从签到获得商业大楼开始我有一个三界拍卖系统无限游戏:十倍奖励重生过去当传奇从大国机长开始亿万富豪从相亲系统开始末日:开局选择时间停止娱乐:巨星演员我,星空巨兽生活系神豪影帝从签到开始全球数据化,我能增幅万物娱乐:开局就和杨老板结婚医路坦途大时代从1983开始修仙从华娱开始万族之劫
最早小说最新小说: 文娱:让你唱歌,你搁这作法?四合院里的老中医地窟求生:开局食物增幅三十倍汽车公司?不,是国货之光再启仙途我的金融帝国热搜第一:叫你捡漏你开挂啊我写的娱乐文被杨老板看到了百元求生:从潘家园捡漏开始带着爸妈去上班娱乐:别联系了,真不熟放弃留学,我打造了世界第一名校从重生开始合租浪在娱乐圈四合院里的唯一老实人韩娱之隔世斑斓怪物食堂首富后才知是反派我的夫妻关系竟能数据化平行空间都市风水师大赌石乾哥传奇神眼少年全能天才混都市绝品全才十二生肖守护神都市无敌特种兵重生圣尊软玉温香极品黑道太子邪霸都市纯情校医校园纨绔特工我的美女上司冰帝校园行护花高手绝品小农民狱锁狂龙3之潜龙出海护花公子全职保安美女校花的贴身高手美女老师爱上我校园超级霸主官运之左右逢源黑客神医贴身美女攻略医道无双极品保镖美女老总爱上我