第91章 数据基建
会程结束后,一行人滞留西尼又游玩了几天,这段时间是难得的放松。
可惜欢乐的时光总是短暂的,除了孟繁岐和唐璜两位休了学的人,其他的四位仍旧有学业在读。
这次正常上课的时间,能和孟繁岐一同过来,已经是相当不容易了。
再拖延了几天,终究还得赶回学校,否则挂上三四科也不是没有可能。
孟繁岐有心提携身边人一把,但也不至于一路护送,让人本科也别念完,这个不现实。
这次带他们过来,主要是让他们见识了解一下ai界现在的情况和潜力。
准备继续留在国内的刘旭,麦芒和秦慧三人,孟繁岐自然是有着自己的安排和打算的。
他希望几人协助去做的最重要的事情,就是在国内建立一个优质中文数据库。
这个东西是未来中文chatgpt能够取得成功最最关键的因素。
孟繁岐有信心凭借自己的能力把西方ai界的资源尽数收入囊中,但他却解决不了中文优质数据不足的这个根本难题。
这也是重生前,困扰华国诸多科技公司的最大原因,优质的中文数据远少于英文。
而优质数据就是ai时代的石油。
华国互联网起步晚,数据积累逊色一些是一方面,一个个都忙着在赚快钱则是另一方面。
这种白白投钱进去,收集数据,标注数据的脏活累活谁肯做呢?
为了中文和华国ai在四五年后的chatgpt时代能够跟上节奏,这件事就只能由孟繁岐提前布局了。
这可是个黑洞一般吞噬金钱的大工程,一位员工的使用成本,一年少说就得十万块,招百来个人,一年过去就是数千万。
收获得只有一堆堆无情的数据,这件事情短期内不会有任何的营收。
四五年的长线,孟繁岐少说得砸三五个亿进去,如果想要数据的质量和规模上精益求精,十几个亿进去也不是没可能。
“还好跟谷歌签了分成合约,否则真不知道哪里去弄这些钱。”
孟繁岐感到了些许的压力,仔细计算了几笔账之后,他意识到自己想做的事情成本似乎远高于自己的想象。
给谷歌的推荐广告算法更新得尽快提上日程了。
“刘旭,麦芒,慧慧,情况大概就是这个样子。三四个月后,我会跟你们具体再联络,你们先负责帮我在国内弄好数据收集这件事情。”
机场,孟繁岐和唐璜要去一趟尚海,其余人则都是回燕京。
此次一别,以后见面的机会不会太多,因此孟繁岐交代了一下后面的大概计划,“这个数据收集的任务,你们不需要考虑营收的事情,不要有压力。这个公司的部门建设出来就不为了赚一分钱,营收的部分其他部门会去做,所有的支出我会负担,工资肯定不会少了你们的。”
让这几位同学先帮助自己打理一下数据的收集事宜,孟繁岐签了谷歌的大单,白度这里的分成就不准备再往美国去转了。
就留在燕京,投进去把中文数据的基建给做做好,不要做个绘图还得转成英文,闹出什么松鼠鳜鱼,胸有成竹之类的笑话。
“先做好数据的基建,等以后有了其他机会,我再跟你们细聊。”
这个ai公司肯定会和白度有些合作,孟繁岐准备借助自己的关系,从白度内部多搞点数据出来。
等他们几个有一些经验之后,跟随技术部门的人和白度之间来往锻炼一下,明年有其他和国内大厂技术合作的机会和任务再交给他们稍微承担一部分也不迟。
当然技术方面肯定会由孟繁岐全权负责。
主要还是这笔数据由熟悉的人去负责打理会比较放心。
“那有机会来斯坦福交流呗。”韩辞前几天并没有给李飞飞一个确定的答复,孟繁岐也不清楚她是怎么想的。
按理说,燕京大学和鄂院士在国内的咖位够大了,但韩辞很清楚,在应数的圈子里做ai和统计,是绝对没有跟着ai新时代的领军人物孟繁岐的脚步,做ai理论和ai解释性划算的。
光是前两天展示的那个排场,没有孟繁岐的实际性能突破在先,这点数理证明绝对是无人问津,门可罗雀的。
不过她此时思绪很乱,完全还没有想明白这件事。
孟繁岐也没有多说什么,他相信也尊重韩辞自己的想法。
不多时,他与唐璜先登上了回国的航班。
这趟过来,除了孟繁岐与韩辞在ai学界声名大噪之外,其余四人当中收获最大是唐璜。剩下三人只是逛逛,见了见世面。
作为当时孟繁岐赛时实验设备的赞助者,也作为前世引导孟繁岐走上ai道路的人,虽然混了一点,唐璜却还是有资格将名字挂在参赛队伍中。
而这也同样为他赢得了入学斯坦福的门票,即便没有全奖和直博的好待遇,斯坦福这所学校的档次也远胜过他原本计划申请的那些学校。
有一个知根知底的朋友在身边,别的不说,以后不少不大方便的事情都可以放心地交给他去办。
况且唐璜在不少方面还是有些特长的,或者说也不算是特长。
比如熟悉二次元在任何时候似乎都说不上是什么优势。
除了这次专程前去尚海收割米忽悠一波股份之外,孟繁岐实在也想不出唐璜的这个属性还有什么用了。
虽然米忽悠此时仍旧没有任何成功的迹象,可实际上这家只有几个人的工作室已经成立了接近三年的时间了。
在11年初的时候,尚海交大的一间宿舍内,几个还在读的学生成立了米忽悠工作室。
谁也没能想到,这家以二次元为主的游戏公司后来能够凭借两三款游戏直接冲到2000亿元的估值。
在新世纪所有起飞的互联网类公司当中,米忽悠的独树一帜还不仅仅在于此。
最传奇的部分在于,这家公司从始至终,都只接受过一次融资。
大家都经常看到类似这样的新闻,某公司获得b轮融资,估值上百亿。
之所以融资,其实就是做事情缺钱。就如现在三位每个月领4000元工资的米忽悠创始人一样。
天使轮、a轮、b轮、c轮、d轮融资,指得其实就是指融资的顺序。
越到后面,公司的产品,盈利方式,规模等方面都越成熟,风险越小。想要取得同等股份,需要投入的资金也就越大。
寻常公司想要做大上市,融个四五轮都是非常寻常的事情,融资的规模几个亿都不算大。
而米忽悠从11年底到12年,辗转了一年多的时间,却一笔投资都没有拉到。
由于三位创始人均为尚海交大科班成员,其实有许多投资人曾经对米忽悠起过兴趣。
只可惜,二次元文化别说在当时,时至今日也难以算得上是市场主流。
尤其三位创始人浓度过高,成分很成问题。