安装客户端,阅读更方便!

重回1988之IT女王第172节(2 / 2)


  “还有就是有的图书馆的书丢了十几年。直到警方退还,才发现原来他们丢了书。平时根本就没有人借阅。”

  说的人觉得挺有趣,说完还哈哈哈的笑。

  安夏却从中想到了另一个的问题。

  被那个贼偷走的书都是珍本,借阅都有门槛,属于想看的人看不到,有资格看的人不一定会去看。

  随着时间的流逝,这些珍本也许本身会损坏,纸张变脆,字迹消失……那就太可惜了。

  到时候,许多书也许就会出现大量丢字的情况。

  后人都不知道那些字到底是犯了谁的忌讳变成的「口口」,还是当初出土的时候本身就是「口口」。

  刚好此时在首都,安夏找到相关的门,以美国的窃书贼案为由头,问他们是否打算把珍本善本孤本也电子化,方便保存和。

  “想啊,但是扫描下来变成图,一张就占特别多的位置,我们现在只存了几本书,就已经挤满了十个硬盘。”

  安夏问道:“我们公司的扫描技术已经可以把图里的字扫出来了呀。”

  “用过了,能扫出来的只有印刷体,连行书都识别不了,古籍上的许多字上都有划痕,系统更认不出来了。”

  难怪字体提取功能上线之后,免费版和收费版都跑得不行,没有出息的项目组以为这个功能过于超前,所以无人使用。

  又因为他们甚至都没做客户登记,连这个功能到底有哪些单位在用都不知道。

  最后散伙的时候,项目经理还发了一封公开信,大意就是:

  世间皆是俗人,把吴钩看了,栏杆拍遍,无人会,登临意。

  那时安夏也没空盯他们这个小项目,就随他们自由发挥。

  哪个公司还不死几个项目的,习惯就好。

  如今她才知道,扫描提字项目组的倒闭不是技术不行,是意识不行……

  安夏自我安慰:算了,五根手指伸出来还有长有短,不能指望全公司上下全都是人精,再牛逼的公司也有翻车的时候。

  记得这个项目组的一部分人辞职走了,另一部分人转行投奔了电子辞典的升级版。

  安夏看了几篇古文原稿,发现肉眼识别的话,问题不大,正经流传下来的书籍和书信一般不用狂草。

  最多就是有点扭动,有点划痕。

  有一种熟悉的感觉。

  安夏想起了验证码……各种登陆的时候,发言的时候,需要输入的中文、英文,还有识别图形。

  人工智能,需要大量的人工对其进行引导。

  人类在用肉眼识别图片,并输入正确字符的时候,就是对人工智能的一个驯化过程。

  “能不能把比较难识别的一些古本扫描图给我们,我们会让计算机学会识别这些字的。”

  “计算机?识别这些字?”古文专家觉得安夏在说天方夜谭。

  “是像《编辑部的故事》里那个人工智能一样吗?”

  安夏笑道:“不一样,那个人工智能是人装的,我们这是真正的计算机人工智能。”

  “它要怎么识字?”古文专家还是想不通。

  安夏跟他说了一通算法、线性回归、计算树以及等等……古文专家露出安夏与阿昕聊天时,听「转录、变异、xx链」的表情。

  最后他的反应也是安夏熟悉的:“啊——原来是这样!太厉害了,那我就期待着你们的好消息。”

  自从年会的时候,安夏当众宣布,要无条件支持人工智能项目组的时候,技术总监心里又感动,又有压力。

  老板这么给面子,要是不干出点样子来,怎么对得起老板的信任?

  之前都是基础研发,现在一下子就来了两个大活,通过活人的行为对计算机数据进行引导。

  安夏把他叫到办公室:“根据你的判断,大概要喂多久的资源,识别字体才能略有成就?”

  “大概要……”他犹豫了一下,大胆的报了一个数:“如果按照现在计算机的使用人数增长率来看,可能需要十年。”

  十年,人生有多少个十年。

  他心里忐忑不安。

  “嗯……”安夏点点头,计算机硬件价格现在还居高不下,大城市的人均拥有量都不高,远还没有到大幅增加的时候。

  从现在就开始囤数据,不至于等十年,以后人工智障应该学会自己把划痕去掉了吧?大概。

  数据收集急不得。

  安夏收到一封来自美国的陌生邮件,自称他们看到了《村庄守卫者》和《王国破坏者》,认为这两款游戏非常有意思,非常有市场竞争力,他们希望可以参与投资。

  “又是一家投资公司吗?”

  安夏找人打听了一下,发现确实有这么一个公司,没什么名气,好像是某大学名下研究计算机的部门。

  安夏拒绝了他们。

  理由很简单:从各种方面来看,他们很穷。

  她需要有一个稳定的投资人,不是投一轮,就把自己给投倒闭了。

  这样会影响紫金后面的生产计划。