第616章机器智能学习创造系统_大明1805

“人学习别人的作品，本质上也是将作品元素完全打碎，变成分子乃至原子状态存进脑子里面。

“然后再自行组合这些原子状态的素材，组合出与原作看上去截然不同的作品。

“只是这些原子太小了，根本无法鉴别出于原作的直接雷同点。

“其实只是人类鉴定抄袭的规则基础上，继续向下无限细分到人类无法认知为止。

“相同的设计图案和段落是不是抄袭？相同的人物结构和大纲算不算抄袭？

“相同的抄设计元素和诗句算不算抄袭？相同的线条风格和词组算不算抄袭？

“相同的颜色范围搭配和词库范围算不算抄袭呢？

“这样继续细分下去，人类学习到最后使用可能是类似的颜色范围和词库。

“机器学习的深度可能比这个更加深入和细化。

“伱用人类法律鉴定抄袭的标准，去鉴定机器学习创造出来的作品，是绝对鉴定不出抄袭来的。

“类比手工织布工匠和机械化纺织机的相同，只能算是使用了类似的棉花和颜色。

“所以为什么人类学习不算抄袭，机器干同样的事情就是抄袭？

朱迪镧笑着说：

“二哥你你可能理解错了我的意思。

“我没说机器学习和创造是抄袭，而人类的学习和创造不是抄袭。

“其实按照我自己的观点，两者都应该算是抄袭。

“就像二哥你说的，只要鉴定抄袭的标准无限深入，所有的学习都能够判定为抄袭。

“在这样的基础上，任何免费学习过别人的艺术作品的人，都不应该创作任何以盈利为目的的作品。

“想要创造以盈利为目的的作品，本人的所有的学习资料都应该是取得了盈利授权的材料。

“因为只要学习过，显然就会受到或多或少影响，不然也就不能称之为学习了。

“是否为抄袭的判断标准，更加准确的说法是允许抄袭到什么级别。

“二哥可以参考微积分和相对论的逻辑来理解这个说法。

“在这样的基础上，现实中的人类社会和人类创作者，已经经过实际上的社会实践和法律，默认授权了其他人类拥有特定级别以下的抄袭盈利许可。

“但是，人类还没有授权机器使用任何级别的抄袭盈利标准。

“比如说，我画了一幅画，默认允许二哥你学习画法。

“我允许你把我的画的原子结构甚至分子存在自己的脑子里随时使用。

“但没有允许你把他们存在机器里面供机器使用。

“机器要学习就要另外要授权。

“因为你说了，机器学习的逻辑，与人是相同的，但机器恰好又不是人类。

“机器学习相关又没有任何现行法律。

“机器学习还没有大规模出现，我并没有直接给过它授权，更加没有给过事实授权。

“甚至没有给过你使用机器学习的授权。

“现在，我们要拟定相关法律，决定默认授权机器学习到什么程度。

“我的建议是全部非默认，任何用于机器学习的资料，都必须得到创作者的直接授权。

“这样做的目的不是为了阻止机器学习继续进化。

“恰恰是要规范机器学习行业。

“未来是大数据的时代，机器学习的规模必然会越来越大。

“如果不限制机器学习的范围和规则，必然导致这个产业的混乱发展。

“必然导致机器学习开发者互相抄袭且不可控。

“抄袭数据原子当然不是抄袭，那抄袭数据库肯定就是抄袭了吧？

“就像照搬一个字库的范围不算抄袭，但照搬一本大词典那就绝对是抄袭了。

“在大数据和机器学习的新时代，数据资料应该是有新的权属规范。

“任何数据和资料，都应该是有权属的，都是有价值的。

“我认为这应该是下个时代的时代逻辑。

“有了这样的基础规则，有了规范的收费和授权的基本规则。

“相应的数据模型开发者，才有机会将通过有授权的数据，开发出同样有授权的数据模型。

“进而可以不受额外限制的使用机器生产的产品去盈利。

“否则，任何机器学习最终产生的作品，其著作权归属都是模糊和敏感的。

“机器不是人类，所以人类可以不保护机器的著作权，完全不认可机器创作的作品的著作权。

“只有将机器视为人类的机器，创作的作品的著作权属于其主人所有。

“才能以人类著作权的逻辑获得保护并盈利。

“但人类想要利用别人的素材盈利，就必须获得对方的授权了，这样也就形成了清晰的著作权归属。

“透过现象看本质的话，用机械智能完成以前只有人能够完成的工作，并且讲产量和速度提升几十几百倍，是又一次的产业革命。

“生产力会再次跨越式的提升，技术能够覆盖的产品的生产成本会大幅度下降，由此产生的效益大幅度提升。

“为智能机器成功运行起来提供原料的人，有分享这种生产力提升所带来的利益的权利。

“不能将个人欣赏学习的授权许可，用于研发和制造任何生产工具。

“这样数据资料有价论的逻辑也就清晰了。”

朱靖垣听完之后看向朱迪钚：

“老二你怎么看？”

朱迪钚沉默思考了几秒钟，最终慢慢的点着头说：

“我觉得迪镧的话有道理……

“用微积分的逻辑来评判和区分学习、模仿、抄袭的界限是个很不错的理念。

“未来的公共网络平台上，创作者上传自己的作品的时候。

“应该有一个是否允许机器学习的选项。

“同时也应该有一个是否使用大数据筛选和推荐信息的选项。”

朱迪镧听了马上附和说：

“我赞成二哥的意见。”

朱靖垣笑着说：

“既然你们哥俩都觉得可行，那这些事情就这么定了吧。

“不过问题是，你们怎么判断一个数据模型，是否用了未经授权的材料来训练呢？

“在数据分析层面你们有办法区分吗？”

朱迪钚想了想说：

“可以在未经授权的素材中添加一些验证数据，规避未经许可的机器学习的使用甚至污染数据模型。

“不过……单纯依靠技术手段是不行的，无法完全规避违规者的破解和甄别以及反破坏技术。

“所以还是要用社会和制度层面的限制以及事后处置方法……”

朱迪钚说到这里看向了弟弟。

朱迪镧想了想说：

“制度上有两个方向，一个是默认全部授权，同时默认全部收费。

“目前互联网上的大规模艺术作品平台，都是朝廷和四大产业集团的官方平台。

“民间厂商和用户想要自行建立数据模型，只能从这些平台上采集数据。

“所以可以规定，没有向现有平台之一付费取得授权资格的厂商，都直接按照违规处罚。

“另一个方向，是就由四大产业集团出面，各自设计一套基础软件框架。

“相当于一个带有强制过滤和筛选功能的装置。

“民间厂商做任何的数据训练，必须在这个基础软件框架之上开发。

“也就是放在这个过滤装置之内。

“这个过滤程序自动甄别未经授权的材料标记，直接不将未经授权的材料投入训练过程。

“同时互联网上应该在授权和未授权的材料上加入专门标记。

“供过这些滤装置直接识别。

“这些方案可以与二哥的技术方案同步实行。”

朱迪钚听了不由得点头：

“好，识别和反训练技术是必须开发的。”

朱靖垣也没有评价两人的设想，就让朱迪钚和朱迪镧哥俩商量着办了。