当前位置:主页 > 期刊 > 数字印刷

海量数据可以卖书也能帮忙印刷

时间:2013-10-11 16:59:50来源:科印传媒《数码印刷》作者:吕理哲
如果有人问你《时间的针脚》这本书看过了没?你刚好没看过这本,或许会有些心虚,觉得自己学问太差或读书太少。一般人没想去反问对方,有没有看过自己刚刚读过的一本书,如果你真的做了,99.99%会得到“没有”的答案。因为国内一年就出版了35万种不同的出版物(Title),一种出版物可能是一本小说,一本12期的杂志或是365天的报纸。一个人即使每天看一本书,一年365本下来不过看了一年国内出版物的1/100,何况还有许多年来一直不断出版的书呢,更何况一个礼拜能看完一本书都不容易呀。
  书市里书太多,出版社想把自己出版的书卖得好,还真不容易,出版就好像普通人不断买奖券一样,期望能中奖(畅销书)。所以大部分的出版社会请一些名人在图书扉页推荐这本书,为不认识作者的读者增加一些好印象。当然,出版社最喜欢找曾经写过畅销书的作者再写一本,毕竟作家是读者找书的重要线索之一,但是作家难免江郎才尽,勉强凑出一本书,常常令读者失望。所以对那些出过很多书的畅销书作者的新作品,我们都会先挑这本书前后几部分读读,看看有没有似曾相识的感觉,避免被偷懒的编辑给忽悠了。
  书的选择太多,书店为了增加营业额,自然把书架上的好位置卖给一些愿意付钱推广新书的出版社,否则就把好卖的书放在好位置上,似乎没有更好的办法去推销书店里的书。
  网络书店像亚马逊有数百万种书要卖,如何推销那么多书,让喜欢看这种书的这种人看到这本书?亚马逊在创业之初,就雇用了十几位书评和编辑,由这些员工操刀,创作书评和提出你看完这本书应该看哪本书的建议。这些人发出的“亚马逊声音”在当时是大家公认的亚马逊最珍贵的资产,也是他们让当时亚马逊远超其他网络书店的竞争者。
  接着,亚马逊的创办人、执行长贝佐斯(Jeff Bezos)开始了一个网络世界重要的尝试——到数据中去挖宝,如果能帮个别客户按照他们的喜好来推荐书,那不是更好吗?从一开始亚马逊就拥有了大量客户的个人信息,还有客户的买书记录,哪些人关注了什么书最后却没有买单,或是考虑了多久下单,或是一起买了哪些书。
  一开始亚马逊还是利用传统计算器运算办法,期望透过样本分析,找出客户之间的相似点,这种技术最多就是推荐一个从事工程师工作的客户购买工程师职业需求的书籍;建议一个买了围棋定式书的客户,买围棋残局的书。就像一个不看书的人向读者提出的建议,只是因为他有完整的书单罢了。
  亚马逊有一个软件工程师格热格(Greg Linden),他在华盛顿大学博士班时主修人工智能,他想出了一个办法,不要去管客户之间的异同,只要管产品之间的关联就好了,格热格这个团队在1998年以此申请专利,把亚马逊的卖书推荐系统整个改头换面,也为海量数据开启了一个全新的应用。
  有了这套系统,亚马逊给上网找书的客户两个选择,一个是计算器找出来的建议,一个是内部编辑的书评,这样的并行作业就是要比较哪一种建议更有效益,可以说是电脑和人的竞赛。
  到底编辑写出的内容厉害还是电脑的建议厉害?哪一项能带来更多的营业额?没想到,仅是小小的测试一下,就发现天差地别,电脑的建议远远胜过精彩的书评。
  没有人知道,喜欢看甲作家的书的人也会买乙作家的书,喜欢惊悚小说的人也会喜欢看历史类的书,为什么如此并不重要,计算机透过书与书之间的关联,让客户一次多买一本书,亚马逊就达到目的了。
  最后,亚马逊制造书评的部门因而解散,理由是他们的书评会影响书店的销售。今天亚马逊33%的书是计算机推销出去的。
  电脑从海量数据中找出事物的关联性,知道“原来如此”就够了,根本不用去理会“为何如此”,就能解决商业问题。
  像谷歌这样的搜索引擎一天就有几十亿的搜寻,几年下来存下来的数据如海洋一样辽阔壮大,谷歌还提供API让你的电脑去海量数据中寻找你要的关联性。
  如果你卖的是衣服,你可能从海量数据中发现下一季少女可能流行的颜色或式样。
  你是搞印刷的,如果你知道什么是最热门的产品,当然愿意给相关产品的印刷品打个折扣。
推荐专题

2019科印游学

科印游学起始于2007年,经过十多年的资源积...[详细]

2019科印传媒活动

以会凝智,以展聚力。...[详细]

2019科印海外游学

科印游学起始于2007年,经过十多年的资源积...[详细]

推荐
  • 资讯
  • 技术
  • 文库
  • 专栏