第三十六章深度学习
什么情况让风无忌竟然这样惊呼出来?实在是结果太让人有些不可思议了。
“他是怎么做到的!”
风无忌双眉紧皱,无言的看着电脑屏幕上的画面。千度的搜索结果一如既往,出现了美女图片和某些“不健康”的内容。
按照他的想法,就算使用标准图片对比的方式,最多也就是把相关图片进行屏蔽。
但让他惊讶的是,不健康图片并没有被整个屏蔽掉——只是关键部位多出了马赛克处理。
没有因为有不健康图片而将千度误判为非法网站,也没有因为有不健康图片而导致更多有用信息同样被屏蔽。这个软件的智能水平,简直是骇人听闻。关键它还这么小,只有300K的体积说明它解决问题的技术思路肯定很巧妙,绝不是用那些很傻的方式实现的!
可是在风无忌的认识里,应该没有任何一种技术能够做到这种程度,就连听都没有听说过!
能够准确的找到关键部位,岂不是说这个程序能够准确的识别图片里显示的是什么?而并非仅仅把图片当成一堆数据,按照数据的相似程度来区分是否屏蔽。
这种技术,简直闻所未闻。这已经有点不像技术,而像是奇迹了。
在祖鲁人眼里,大概火枪和大炮也是奇迹吧。要知道侯世达使用的图片识别技术,在十年后也是很高端的应用。
图像识别,这是人工智能研究的一个重要课题。让计算机能够看“懂”图片表达的信息,这是这项技术的最终目标。
别看仅仅只是屏蔽不健康图片这样小的一个功能,它背后使用的却是在2011年才有所突破的神经网络和深度学习技术。在图形的识别问题上,可以说真正的迈进了一大步!请记住geoffreyhinton这个名字,就是这个人,一步步把“深度学习”从边缘课题变成网络巨头们仰赖的核心技术。
后世谷歌眼镜现实增强、图片识别搜索、人脸识别,乃至自动驾驶汽车等等尖端领域,都是应用了神经网络技术。
在人工智能技术发展还很原始的这个时代里,这个技术说是神迹其实倒也不差。
“等等,还不能确定,我需要更多的验证!”
风无忌精神上明显振奋起来,这是一个成功的程序员在面对自己不了解的技术,自然而然迸发出来的求知欲。
……
几乎一整个上午,风无忌都在使用各种方式测试着这个程序。而最后的结果,让他不禁有些目瞪口呆。
“90%的图片识别率,不是使用黑名单方式区分网站,而是根据页面显示内容判定。正常的网站只屏蔽图片,非法网站则限制网站访问。”
“除了图片识别,它在自然语言识别上也有相当优势。不不,如果只是图片被屏蔽了,我也不会这么惊讶。关键是它能对关键部位进行马赛克处理,你听明白我说的是什么吗?它能看的懂图片是哪里违规了!”
“对对,这真是太amazing了!”
“最关键的是你想想看,如果它能识别图片里特定的细节显示,那么它能不能实现对生产线上产品状态的识别?”
“还记得丰田新生产线那个项目吗?如果能把这个技术应用到机械手的控制上,自动化程度至少能一次提高30%!”
“中动软件和咱们有什么相干?他陈辉再牛,难道比丰田的分量还重?老总,机不可失失不再来啊!”
……
风无忌兴奋的撂下电话,他是大港市一家上市的嵌入式设备研发公司的软件总工程师,对工控自动化和数据库方面非常有研究。
工控领域离IT和互联网似乎有些远,但实则不然。在罗汉堂内堂里,像他这样做嵌入式系统的程序员,是能够和电脑软件程序员、网络程序员相提并论的大团体。
只不过自动化讲究精确控制,侯世达之前提出的模糊逻辑从名字上,对工控就没有什么吸引力。
风无忌并不知道,在侯世达重生前的世界,模糊控制是工业自动化相当高端的领域。没有模糊控制,自动化就不可能在生产线上彻底替代人的作用。
不过作为一个工控方面的专家,以他敏锐的嗅觉,却能轻而易举的在侯世达编写的这个小软件里,闻到一种“革命”的味道。
视觉识别技术发展出来的模糊控制,绝对是工业生产线上的革命技术。
侯世达刚刚将任务发布出去没有一个小时,他的任务市场客户端就收到了一条私信。打开一看,竟然是一个名叫“勇者”的成员发来的一串企鹅号码。
套上伪装,数据加密,连接代理服务器,重新申请了一个新的企鹅号码,侯世达也算是在自己力所能及的范围内做好了安全的保护工作。
匿名:你好勇者,对我的任务有兴趣?
勇者:我能问一下,你是怎么实现这种技术的吗!
侯世达不自觉的“呃”了一声,摇头笑了笑,看起来这个勇者倒是有些迫不及待了。想想也是,这是罗汉堂内堂,怎么可能会有不识货的人?既然对方识货,就一定会为这个软件使用的技术感到震惊。
匿名:对不起,这个问题我恐怕无可奉告。
勇者:呵呵,不好意思,是我提了一个不恰当的问题,抱歉。
勇者看起来失望不小,接下来的谈话里就少见开始的激动了。他仔细的询问了侯世达对任务的要求,包括可能会来自哪些方面的压力,确定了不会涉及到违法行为。当然,如果是上级部门下文要求撤销,这也是等同于法律效力的。
不过侯世达特别强调了,如果是非网络管理部门的要求,希望接受任务的网站能够顶住压力。
勇者沉默了一阵,突然转变了谈话的方向,将问题引导到了报酬方面。
勇者:你能支付什么作为报酬呢?
侯世达想了想,自己手头这不到十万块在罗汉堂内堂成员眼里大抵和零花钱差不多,就别丢人现眼了。而这边罗汉堂内堂的通用货币有50LB,却是相当有吸引力。
LB并非是没有价值的,它能购买论文库里的专业论文,同样也能购买内堂成员们的服务。世面上的LB兑软妹币的汇率,保持在1LB兑换10000软妹币的水平上。
就这还别觉得吃亏,1LB兑换出来的论文如果解决了某人的技术难题,说不定就能创造出十倍百倍的利润来。说白了,对内堂成员来说,钱是远远富裕的,但知识和技术却是远远跟不上供应。
很多项目里如果用10000块软妹币解决了瓶颈难题,顺带提高了自身的技术水平,这是多少普通程序员上杆子求都求不得的好事。
匿名:使用LB怎么样?我出30LB。
30LB,这几乎是一个普通内堂成员大半的身价了。普通论文也许一年能收获5到10个LB,也只有侯世达模糊逻辑这样开创性的论文,才会在这样短的时间里引发这么多人的兴趣。
勇者用了不断的时间思考,显然30LB对他的诱惑不小。
勇者:我有一个提议,如果你能同意的话,我不仅以你的要求帮你完成这个任务,还反过来提供给你10万块钱或者10LB。
匿名:哦,请详细说说。
勇者:我手上有一个项目,需要类似于这个软件的视觉识别能力。
响鼓不用重锤,侯世达顿时知道了他的意思。恐怕勇者从一开始抱持的就是这个想法,先是看上了这个软件的技术,然后才决定接这个任务。
如果自己不同意这个要求的话,就算支付LB作为报酬,也买不来对方的绝对支持吧。想想也是,能够硬抗中动软件压力的企业,又怎么会在乎这一点小钱呢。
中动软件本身股价几个亿的市值,没有同等量级的背景谁敢出手揽事儿。为了区区30个LB冒这样的风险,这不现实。
侯世达想了想,决定答应下来。神经网络技术关键的是得出特征参数的算法。而提供给勇者的程序,当然还有这个过滤不健康信息的软件,本身并不包含算法本身,而是算法算出的参数结果。
别人就算拿到程序反向编译,也只能拿到一堆自己看不懂的程序。就算勉强能用,应用范围也会极其狭窄,并不用担心技术外泄或者扩散。
匿名:说说你的项目吧,如果能力所及,我想我们可以交个朋友。
勇者:好,我手里这是个工业项目,涉及到自动化控制。如果你的视觉识别能对产品状态进行识别。
……
侯世达深呼出一口气,这个风险最大、最困难的一步总算是完成了。接下来就是继续观察网民对四千万事件情绪发酵的结果,只要这个话题能够继续炒热,那就到了给与中动软件致命一击的时候。
此时此刻,陈辉和他的中动软件,大概还沉浸在虚幻的胜利之中吧?
ps.果然有人在喷所谓的“送股份了”,我就知道肯定有人会觉得,你主角不把100%的股份握在手里就是脑残,是弱智。嗯,想来马云、李彦宏、马化腾等人也都是脑残、弱智,因为阿里巴巴百度和腾讯的股份,也都不全在他们手里。创业公司千头万绪,人才凭什么在你这里,而不是去大公司……算了,真说这些估计挑剔送股份的也不会理解。如果说真觉得连这种程度的现实操作都接受不了,那我确实是没法伺候您了。这本书的定位,就不是那种把所有钱都搂到手里的无敌文。作者不敢说书里写的道理一定对,知识真的有多高大上,但是看过胖周书的读者都知道,我在书里除了是努力给读者带来愉悦,也希望能够看完书让读者有所收获的作者。我完全可以写主角是个铁公鸡,把所有的钱都自己赚,所有的权都自己掌。但读者真要是拿这种内容去跟人侃大山吹牛,结果反而被人现实打脸,对不起我胖周担不起这个责任。