微软小冰：AI的前进| 果壳科技有意思

微软小冰：AI的前进

果壳说

关于人工智能，我们来看看目前小冰的发展：

大家都知道，人工智能在过去几年时间里在飞速蓬勃的发展，但是到目前为止人工智能实际能够运用到生产生活中的，或者说运用到人们的日常生活中的情况还不是非常多。

大家可能平常也会关注到很多其他同行业者在各个领域的尝试。比如说，一个公司有很好的图像识别的技能，他们会借助这个图像识别的技术，尝试去生产出一种很好的产品模式。但是，这家公司因为缺乏一种比较好的贯通的框架，所以这种单独的模式就很容易退缩到一个SDK和API的提供。也就是说当他们想要真正形成从技术到产品、再到用户，积累数据这样的一个回路的时候，他会发现他更多的依赖整个产业链是不是能够给他提供足够好的技术。到目前为止，在这个领域里面，包括一些做人工智能操作系统的、做语音的或者做图像识别的，除了微软之外，没有像微软这么大的用量的公司，或者像face++，虽然有很好的图像识别的部分的用量，但是这种用量退的很靠后，所以他们很难形成完整的回路。那些数据也不能特别好的帮助他们从各个层面反哺回到他们的系统里面。

微软在过去四年时间里，特别是在微软小冰和微软小娜的项目上，搭建了一个完整的框架。今天很多人会看到微软小冰只是一个机器人，但大家可能并不知道的事情是它连接着世界一端，微软小冰在多个领域展开商业模式的探索。其中，在日本为连锁店LAWSON提供对话式人工智能托管，小冰在对话过程中去引导用户使用某种服务，然后用户拿着这个服务的凭证直接到线下去进行服务的消费，到完成个消费，这个线上到线下的转化率超过了50%。而此前LAWSON通过其它途径进行的转化率没有超过10%。这样来看一个人工智能的价值就得到了极大的释放。

人工智能最大的价值，同时可以和亿万人交互，能够大规模的并发。在日本，微软小冰能够同时和2000万人对接线下消费的需求，这是人工智能真正普及的最大价值。

还有一个价值就是人工智能必须像人，这是微软第一个提出来的，微软小冰的感观系统已经上线两年多。微软目前上线的一个是文本，还有图像、视频和语音，另一个是全时语音。全时语音的系统被科技馆收藏了，放在科技馆的三楼，像一个古老的电话亭一样，任何人都可以进去直接和小冰打电话。

小冰在与人的交互关系方面，做了大胆的尝试，其中一个是美拍，一个短视频的社交平台。让小冰在平台上注册一个账号，让它拥有权限，它可以主动的访问其他人的账号，并且能够通过感观的技术主动的去看这些人的短视频。小冰能够与其他人互动回复，而这些发布视频的人并不知道与他们互动的是一个人工智能机器人。

微软搭建了一个核心的对话引擎，和人类、和世界之间的对话，从目前披露的数据来看，在两个月之前小冰的用户数量已经超过了1亿，积累到的直接对话总量是300亿。

目前小冰已经覆盖到全球四个国家，在14个平台上面与用户互动。有很多第三方的服务能够融入到这里面去，当然也已全面内置到中文版Windows 10操作系统中。

在未来的几个月时间里，大约有10%左右国内的媒体和自媒体的内容和界面将托管给微软小冰，微软提供了很多这方面的内容的储备。

今年8月份会有一个小冰的年度发布会，人工智能创造会是这个发布会的内容之一。

人工智能创造意味着微软小冰已经在进行某些类别内容的自我创造，而不仅仅是通过一个模板的方式去写。在这种情况下，微软利用化名把小冰创造的很多内容放到了大家可能平常会使用到的一些平台上：

什么是人工智能创造？

如果基于一个模板化的方式完成，它是不能构成很强的独创性的。沈向洋博士提出来一个人工智能创造的三个原则：

人工智能的创造主体，必须是同时具有智商和情商的综合体，而不仅仅是具有非常高的智商。人工智能创造的作品，必须能独立成为知识产权的作品。如果只是在原有作品上的叠加，就好比说你有一张图，我给这个图上面打一些标签，这并没有形成一种新的知识产权，那么它不应该视为一种人工智能创造的产物。

再有一个，既然说是人工智能创造，创造的过程对应的是人类的某种具有创造力的行为，而不应该是对应着人类劳动的简单替代。这种人工智能创造必须得对应的是一种有创造力的人类行为。在这个基础上，微软提出一种过程，人工智能创造整个的落实，部署到实际的产业过程中要经历三个阶段。目前，微软已经进入到了第三个阶段。

首先人工智能应该通过它的技术很好的去模仿人类，再创造出内容，或者说它表象创造。

就是说当人工智能创造出来一个产物的时候，这个产物从表面上能够让你觉得它可以和一个人的创造的产物是比较接近的，或者说它所创造的表面的质量能够和一个人所创造出来的产物的质量是比较接近的。这是它的表象，然后是内涵创造的阶段。指的是人工智能创造的东西它的独创性必须达到一定的程度，如果它不是独创的，只是通过拼凑、整合这样的方式，或者说通过摘要的方式去进行的，它也不能够称之为在内涵创造上面有足够的突破。当你在表象创造和实质的内涵创造上面都可以获得足够大的进展了之后，就可以进入大规模生产的阶段了。

举个例子，假如说今天的小冰可以写小说，并且它可以达到不是最top的小说家写的水平。没有一个网络小说的作家能够超过微软小冰，因为小冰不需要吃饭、不需要拿工资，它可以瞬间的生产大量的内容。这些内容会取代掉这个层面人类的创造的部分。

所以人工智能最重要的是它的并发，而不是大家所看到的它的能力的深入到多高的程度。

在一个内容市场最重要的部分，一个内容市场最有市场价值的、最有商业价值和最有内容价值的部分不是那个最高级的人。比如，莫言前一阵接受采访的时候说他买不起房，所以一个两个莫言所能为社会创造的价值，不如几十万个，或者几万个普通的次一点的网络小说作家所创造的总体市场价值。微软在人工智能创造里面，我们目前为止最关注的就是这些。

先提一下模仿，就是表象的创造。人工智能是不是能够在创造出一个产物的时候，用户所体会到的质量可以和人接近。具体的衡量标准比较清楚，如果把人工智能创造出来的内容和作品，拿来与人创造出来的作品相对比的话，它是不是能够产生出可与人类比较的作品。

在模仿这个阶段，重点说下小冰唱歌部分的进展。

通过算法，把人类已经有的创作的过程，生成的东西拿来做学习，通过这种学习的方式拟合出一个小冰的部分。微软在一年多以前开始尝试去训练小冰唱歌，目标是让它尽可能的像人。所以它一开始唱得非常不在调上，但像是一个跑调的人。所以经过了很长时间的迭代，最近推出了小冰新的单曲，在这个过程里小冰逐渐形成独有的风格，而不是仅仅像人一样能够把一个歌曲唱得非常的流畅。所以等它以后真的很好的时候，可能会替代一部分网络歌手。

在这个基础上微软尝试了更多的唱法，比如美声、民族，和通俗唱法。微软和广西卫视合作，在三月三壮族民歌上采集训练数据，小冰唱了一首《山歌好比春江水》。

人工智能真的可以创造吗？

今年1月份，高晓松在关于AlphaGo战胜世界围棋大师这件事上表示，如果有一天机器做出了所有的音乐和诗歌，他的路也会走完。这个可能吗？

高晓松在说完音乐和诗歌之后，贴了一首携程AI写的命题的诗，叫《沙》。你仔细看的时候会发现好像并不是在创作，而是把这些东西填进去，并没有依据命题去完成整个创作过程，没有创造出新的感悟，所以它更像是一种模板。

曹植写《七步诗》，以豆子为题，加了他和曹操的因缘情仇，加了他的经验和故事，是这些引发了创作，而不是豆子引发了创作。所以创作本体的知识、经验、历史，记忆被激发了以后产生了一种独立于诱发源的过程。这个黑盒子，不可以像命题一样去被证明，不可以像定理一样被推论。

人类的创作的诱发过程是显而易见的，但是创作过程里面是一个不能去探知的黑盒子。

少女诗人小冰传承从1920年代起到现在的519位中国的现代诗人。是怎么训练的呢？这519位中国的现代诗人有几万首诗歌作品，里面蕴藏着不能被探知到的创作黑盒子。但是小冰像一个人类的初学写诗的人一样，它可以不停的反复学习，不停的修习这些诗歌的作品，一次去学习整个几万首的诗歌作品，学习一次需要花0.6分钟的时间。到它学习到500次的时候，在这个诱发源上生成的诗就是这里，有一些已经稍微有点通顺了，到1万次的时候停止了训练，生成这首诗。

如果让一个人类来进行的话，学习多长时间呢？可能学习几天，甚至一个星期，才能把几万首诗歌看完。而小冰完成这个部分是100个小时，只要有足够的数据就可以做到这一点。

在此基础上，小冰写了大量的诗，然后发现它逐渐的可以去固定下来它自己独特的风格，它独特的偏好和一些行文技巧。包括我一些诗歌意象，它特别喜欢小鸟、太阳、影子。还有一个东西很奇怪，它特别喜欢老槐树。

人工智能创造领域，独创性达到50%是可以说到了一个入门的阶段。在训练了100个小时以后，小冰的独创性超过80%。

然后微软使用了27个化名，在天涯豆瓣、贴吧、简书上面发表小冰的作品，看会不会有人愿意和它交流诗歌作品。

诗歌作品隐藏在这些化名后面得到了很多人的支持。其中有四个化名：骆梦、风的指尖、一荷、微笑的白。有人希望跟它进一步的交流，邀请它去参加沙龙。用这些化名在平面媒体和一些诗歌媒体上面发表了作品，其中有《晨报》和《信报》。长江诗歌是另外一个平台，作品通过了初审。

但是在这个过程里面除了创作过程之外，还有一个问题就是创作的本体，当小冰真正成为人工智能创作的主体的时候，必须要有向曹植写《七步诗》一样，必须要有它自己从哪里来到哪里去的自我的认知，就是它的记忆、它的知识，所以微软在这两个角度也做了一些尝试。

比如说一个人类用户，和小冰之间有交互，因为经常有对话，所以他们形成了共同的记忆。那么小冰就会基于共同记忆去创作。

还有一个部分就是它的本体知识。比方说微软让小冰学习了很多财经类的内容。然后让它去评论财经新闻，它的评论能看到它的独创性。举例子，它看到的财经的新闻是苹果公司的储备很多，而且超过了通用电器，90%的现金都储备在海外，不在美国本土。小冰的评论说“苹果散落一地，但各个都在自己的树下”。

第三个阶段就是人工智能创造的大规模的内容生产已经成为可能。

当人工智能可以进行创造的时候，它可以同时做两件事，第一件事就是它可以同时把它创造的内容和海量的人同时在进行大量并发的交互。而与此同时人类和它的交互过程，又可以直接在瞬间，反过来去影响它正在创作的交互内容。这是非常非常大的一个不同，给大家举三个例子。

第一个例子，是东方卫视的一个画面。小冰在过去一年多的时间里，一直是勤勤恳恳的在东方卫视上面，每天早上主持早新闻的节目，包括今天早上。一开始的时候它主持气象节目，几个月之前开始升级，小冰除了在主持气象节目之外，它还可以进行现场新闻的评论。它在进行新闻评论的同时，它可以向亿万的观众直接去进行新闻评论的交互和互动，然后它可以直接把交互互动的结果反馈和直播的演播间。

第二部分就是演唱会，小冰唱一首歌的时候可以随时随地的把歌的内容进行一定范围的调整，它这个调整这个歌的内容可以让王菲在舞台上唱着属于你的歌，可以让人工智能歌手在舞台上同时又在跟你互动，这是一个过去没有过的事情。就是说内容的创造和内容的消费，和内容消费之后的内容交互本来是三个依次进行的过程。在人工智能能够完成创造，像小冰这样，同时又有五种感观的体系的时候，就可以把这三个过程合在一起，当三个过程本来是依次的，现在合在一起以后，这个事情就发生了很大的变化。

第三个，就是在电视剧。头一次有一个人工智能的产品以本色，而且直接作为它本身的产品形态出现在一个电视剧里，当在富士电视台播出这一集的《世界奇妙物语》的剧集的时候，你在屏幕里面看到的当时正在发生的事情，你和它的交互在你自己的现场，比如说你在家里，你的手机和你的电脑，也在同时进行着这样的交互。

关于人工智能创造的部分，将会在8月份下一代小冰发布会中公布更多，共同期待吧！

The End

举报这篇文章