《崛起于2009》第227章 霍从军的爱女

    “人脸识别”项目只用了10天时间就开发的差不多了,叶晓奇隔三差五的都会出现在项目组里,解答问题和开小灶,各个项目组都有了初代的代码。

    也就是说18个人,一共产生了4套代码,在这4套代码里叶晓奇打算找一套质量相对较好的,经过训练后再交付给总承包方,这事就算结了。

    图片识别的问题,代码是一方面,海量的训练是另一方面。好在“人脸识别”属于特定领域的ai视觉问题,相关的技术储备都差不多比较成熟了,其准备率相较于泛性的ai视觉,要高上很多。

    这里面最大的问题还是权值的问题,卷积计算的乘法系数和均值计算的偏差系数,都是需要经过多次调试的。这个系数开不了挂,后世几百套相关的架构,其系数都是不同的,适合自己的,才是最好的。这里面,服务器上新安装的侏罗纪贡献的10个gpu,发挥了巨大的作用,在“学习”的过程中极大的提高了效率。

    霍从军也来过几次,达成了一系列的校企合作协议。

    紧跟着没两天,天网课堂第二届也已经开始了,第一届“留级”的孩子将和这一届学员一起上课。

    课程还是那些课程,同样要求保密,这一届学员已经换成了委培应届生,学员规模已经扩大到了50个人。

    但是和第一届相比,这一届有了很大的不同:首先不再是薪资系数评定了,而是纯考核制,同样的四朵小花,拿到2朵为合格,3朵及其以上为良好。学员毕业后的初始薪资直接和学习分数相关:2分5000元,3分8000元,4分12000元,1分的退回学校。

    校企合作的第二条则是委托填充数据集的工作,被称之为白垩纪“勤工俭学”计划。简单来说就是找照片,一张照片附带至少5个标签,参与的学生可以得到一毛钱。在此基础上,该图片每个新增的标签可以多得2分钱。同样,给数据集中的已有图片打标签,也是2分钱。

    举个栗子,一张带有汽车的图片,根据图片表现内容,可以有以下几个标签:汽车、轮胎、法拉利、后视镜、飞翼门、玻璃、方向盘、雨刷。这就值1毛6分钱。

    搜集来的照片打标签也不是没有要求的:首先是不能出错,不能乱打标签,图片标签出错的,后台审核人员发现后,会扣除这张图片的三倍收入。其次是不能重复,一模一样的两张图是没有意义的,这点天网团队后续将开发出一套程序,专门用于检测图片是否相同。

    “勤工俭学”的费用都估算过了,这么算下来,假如一个学生这一天什么都不干,专门搞这个,少说能完成200张图片,拿到30块钱。初期的图片还特别好找,因为不存在重复的问题,随便拍一张肯定是数据集里不存在的,这样下来一天500张照片都是轻轻松松,比在有些公司里上班都安逸了。

    同时还有一条附加条款:如果一个学生在一个学期里搜集图片超过1万张,且错误率不超过0.1%,该学生本学期将会得到由红烧肉赞助的奖学金,奖学金金额等同于该学生的一年学费。如果该学生的专业对口,且在校表现优异,毕业后将由天网项目免试录取。

    李飞飞不止一次说过,数据集不好做,本来想找学生做的,最后发现成本负担不起。那是她没找对地方,论人工论素质,还没哪个国家能比的上国内的,米帝的学生多贵啊。

    而国内最不缺的就是为五斗米折腰的人了,多的是贫苦家庭出身的孩子。有的五口之家里,为了给弟弟妹妹们省出个学费来,舍不得吃,舍不得穿,常年的营养不良就不说了,还要一边上学一边给人当家教。

    这些带有标签的图片组成的数据集,在达到一定规模后,将运用到ai视觉的深度学习中,提高计算机的“智能”属性。

    在达成协议签字后第二天,叶晓奇终于见到了霍从军嘴里“温柔美丽、落落大方、才貌双全”的爱女,斯坦福毕业的硕士生,26岁的霍蓓蕾。

    厚厚的黑框厚瓶底眼镜遮住了脸上一半面积,一身阿迪达斯的休闲服和斯凯奇的运动鞋把全身防护的严严实实的,五官谈不上丑,也谈不上美,反正扔人堆里肯定就找不着了。

     
猜你喜欢
返回首页返回目录