从“语言+”到“知识产权”:语言资源知识产权法律保障研究
上QQ阅读APP看书,第一时间看更新

四、本书研究方法与主要框架

(一)语言知识产权研究现状

就目前的总体研究状况来看,关于语言资源与知识产权的研究在数量上是比较多的,但呈现出研究点比较分散的特征。这些研究散布在以“语言产业”“语言资源”“数据库”“语料库”“字体”“字库”“字幕”“语言技术”“翻译”“汇编”“品牌”“广告”“试题”等主题词为主的版权、专利、商标保护问题讨论中,少有从整体的语言产业或语言资源知识产权保护的角度进行深入讨论。一方面,从事知识产权理论的研究者多从具体法律规范角度进行研究,研究视角集中在作品的法律定义、思想/表达二分法、字体字库的版权保护、语言技术专利分布等法律技术层面;另一方面,从事语言资源与语言产业理论的研究者,则更多是从产业宏观发展的需要,呼吁对知识产权制度的整体关注。

对知识产权制度的呼吁是跟产业发展与市场需求密切关联的。2009年,时任国家语委副主任李宇明指出,我国语言产业发展的桎梏之一就是在法律层面缺乏对语言高新技术(特别是信息产业)的知识产权保护。计算机字库的知识产权问题、语料库的知识产权问题、输入法的知识产权问题等都是比较典型的事例。[51]对于这些问题,国内学者不乏关注。贺宏志、陈鹏对我国大陆和港台地区与日本中文字库的分布情况,以及我国数字键盘汉字输入法技术专利90%以上被外国厂商所垄断的现状表达出担忧,认为知识产权有效保护是语言产业健康发展的重要保证,要推进语言产业的发展,必须加快语言产业领域知识产权的立法,加大执法力度,依法惩处侵权行为。[52]赵世举也认为我国语言资源开发目前面临的一个很大难题是知识产权保护问题。由于社会整体的知识产权意识薄弱,字体字库产业面临生存危机。二十世纪九十年代,我国字体字库设计研发企业有大大小小几十家,如今10人以上规模的研发企业仅剩5家,且处于勉强维持状态。这已严重影响语言科技与语言经济的发展。[53]张卫国则从推动语言科学技术的研发应用角度出发,指出要努力加强语言数字化、信息化技术研发,建立和完善语言技术知识产权保护法律法规体系。[54]实际上,在2012年全国两会上,不少人大代表提交了多项有关字体字库著作权的议案,诸多专家学者、法律界人士呼吁通过法律保护字体字库产业。

因袭知识产权法版权、专利、商标三位一体的体系结构,知识产权理论对语言的关注也基本上从各自的视角进行。语言文字天然地与版权结合在一起,成为版权法关注的焦点,但是传统版权理论研究者更多是从语言文字所构造的作品而非从语言文字本身进行研究。作者为了对其观念成果享有所有权,必须找寻、构造或者拟制一种财产权支配的对象。这种对象只能是作者所创造的,若无作者劳动则不会产生的产物——“作品”。作品由书面文字表达构成。关于这一文字产权的范围,早期法院认为作者权利仅是对“特定文字组合”构成的图书版本的复制权利,这样的观点是不对的,这一做法实际上将作品的翻译权排除在外。但是,文字的财产权不能仅限于语言本身,语言表达的内容构成了文字作品的精髓,体现了作者的劳动与才识,可以用不同的语言来表达,因此翻译作品从内容看并非新作,只是以新的形式复制原作。随着作品的概念成熟起来,反盗版开始向反抄袭过渡,将表演权、翻译权与改编权等内容纳入进来。沿着这个思路,学术界的研究逐渐围绕“思想/表达二分法”“独创性标准”“剽窃与抄袭”“形象化权”等问题展开。这一进路虽然没有将语言问题单列,但通过对作为作品主要表达媒介的语言文字应当满足的条件、覆盖的范围等问题的分析表现出来。

因此,在我们以“语言产业”“知识产权”“language service”“lan-guage industry”“intellectual property”等为关键词在中国知网、北大法意、HeinOnline、Westlaw、ScienceDirect、JSTOR等期刊数据库上进行联合检索时,发现极少有进行专门研究的文章。不过,随着研究的领域愈加深入细化,研究的资料逐渐开始增多。例如,关于语料库的保护模式,有不同的主张。有的主张基于著作权法,以汇编作品或数据库权利进行保护[55],有的建议建立特殊权利保护模式[56],也有的主张以“版权+特殊权利”的双轨制模式,或版权法结合反不正当竞争法的模式。[57]与将版权问题纳入“作品”和“数据库”等概念之中研究的进路不同的是,进入二十世纪之后出现的几次关于字体字库的诉讼,引发了知识产权学界的高度关注,出现了一大批关于字体字库版权保护的研究成果。[58]由于新东方试题案引发的争议,学界也对这类问题有所关注。[59]除此之外,学术界对近年来引发争诉的电影字幕侵权、书法作品的版权保护、配音产业版权问题以及网络中版权侵权行为(如同人作品、洗稿等)纠纷也都予以了相应的关注。[60]

与语言中的版权研究相比,语言产业中的专利制度显得较为简洁明了,主要集中在以下三条路径:

第一,研究关于专利制度发展过程中的语言变迁特征。谢尔曼和本特利对十九世纪英国专利制度的变迁史进行研究后发现,专利制度的发展动力开始从“神圣的主体”转向“封闭的系统”。十九世纪中叶之后,一整套标准化的现代专利制度陆续诞生。这套制度规范、塑造、整合并引导现代技术知识的生产与流通秩序,它不再是针对特定问题作出专门回应,而是变成一个运作封闭、认知开放的自我指涉系统。这一系统的变化使得专利从一个发明技术的事业变为一个语言文字的事业。通过对权利要求的起草方法施加更多的控制,以及控制文字撰写的方式、纸张的大小、边距以及图纸的格式、大小和比例,法律限制了用来说明该发明的方法。经由这种方式,法律也限制了所保护的客体的范围。[61]

第二,研究关于语言处理技术的特殊性,以及与此相关的专利适格性要求,也即相关的专利实质条件要求。这主要包括《专利审查指南》关于语言技术(如汉字编码类型等技术)的新颖性、创造性、实用性的判断标准等。[62]

第三,研究与语言产业中的语言技术专利诉讼纠纷以及与之相关的专利布局态势等。2019年,国家知识产权局组织专家,从人工智能关键技术的角度,针对与语言处理有关的技术,分析了专利分布态势。这主要从两个视角——计算机视觉技术与自然语言处理技术——来进行分析。通过对技术进行分解,确定检索策略,展开(推进)专利检索、数据分析等流程,对两个领域中的专利分布态势进行了相对全面的分析与研究。[63]语言技术专利之争在百度与搜狗关于输入法专利的诉讼之后引发了热议。[64]

与语言有关的标识中的知识产权研究主要沿着以下几条进路展开:

1.与语言文字有关的商标保护研究

与语言文字有关的商标问题研究主要散布在这样几个领域:一是商标语言文字结构、美学、特征、语义等方面的研究,这类研究的目的主要在于提高商标设计、使用方面的美感,从而提升商标的价值。这是商标的语言文字符号学研究进路。[65]二是商标语言文字的法律进路,重点研究商标语言文字能够覆盖的现实商品的范围、商标用语与姓名权的冲突、域名与商标权的冲突、商标语言的可识别性、禁用性、通用化、淡化、混淆、联想等方面的问题。[66]三是对商标广告用语中的规范问题进行研究。规范广告用词行为可以视为是规范商标行为,在这个意义上,广告用语措辞与商标具有紧密的联系。[67]

2.与语言文字有关的特殊标志管理研究

与语言文字有关的特殊标志管理的研究主要集中在奥运会、世博会、亚运会这类大型会展标志之上。各国基本上都会对特殊标志予以专门管理,国际组织(如奥委会等)对于自己的标志也有自己的管理政策。我国对奥运会、世博会、亚运会等标志出台了专门的管理规定。此外,还有一些对地理标志等特定类型的标志中语言用词的法律意义进行的研究。[68]

3.与语言文字有关的专名管理研究

有一些对于专名管理的研究值得一提,例如姓名登记、地名管理、企业名称登记管理等。[69]当然,这些专名的管理,主要属于民法姓名权等范畴,还不属于典型的知识产权规范的范围。不过,当姓名权与其他知识产权(如商标权)发生冲突的时候,又开始与知识产权纠葛在一起。尤其是“乔丹案”“邓紫棋案”之后,学术界掀起了关于姓名权与商标权问题的热议。[70]当然,这一热点研究还涉及企业名称权与商标权之间的冲突。[71]

(二)研究思路、方法与框架

1.研究思路

我国拥有悠久的历史文化,语言资源丰富,但是语言产业不算十分发达。本书根据语言资源与产业中的特殊性,就不同类型知识产权的保护原理、知识产权分布态势与诉讼状况等问题进行研究,既涉及语言中的版权、专利、商标等不同类型,又涉及语料库、语言博物馆、语言翻译技术等不同领域,以期为语言产业提供周密、严格的知识产权保护,进而帮助充分挖掘我国语言资源的内在价值、推动语言产业的快速、良性发展。因此,全书的总体思路可以归纳为“一套体系、两个层面、三只眼睛、四个环节、五大手段”。

所谓“一套体系”,指的是力图构建一个语言资源中的知识产权保护体系。这一保护体系可以概括为:“四阶层”(自力救济措施、民事法律制度、经济法律制度、刑事法律制度)、“七维度”(合同法保护、版权法保护、专利法保护、商标法保护、商业秘密法保护、反不正当竞争法保护、刑法保护),同时,我们意图据此建立起一套语言产业中的知识产权保护与监测体系。

所谓“两个层面”,指的是语言资源中知识产权保护体系应当着重从“线上线下”两个层面进行构建。随着现代数字信息技术的发展,越来越多的语言资源与成果开始以数字化的形式在网络空间流动,越来越多的语言处理技术都是数字网络技术,包括语料库建设、机器智能翻译等。因此,语言产业中的知识产权保护与监测体系必须同时从“线上线下”两个层面进行关注。

所谓“三只眼睛”,指的是语言资源中的知识产权保护体系要注重建立“监测之眼”“分析之眼”“保护之眼”,通过加强对信息源的实时数据流进行收集和分析,帮助和发现来自公开市场以及国内外的不可见风险,如侵权、盗版、灰色语言产品市场等。在加强“三只眼睛”的同时,还应当建立“三盏灯”,亦即监测过程中的“红黄绿”三盏灯。对于一般社会大众,采用正常“绿”灯模式,即正常的网上数据收集监测模式;对于与知识产权人同行业的语言产业,则采用“黄”灯模式,即关注程度高于绿灯模式的监测与数据收集;而对于与知识产权人有竞争关系的对手或产品,则采用“红”灯模式,予以重点关注和监测。

所谓“四个环节”,指的是语言资源知识产权保护体系构建的核心重点在于构建“获权—监测—预警—维权”四个环节的流程。语言资源要求所有人定期对自己拥有的语言成果进行检视,根据需要及时申请注册商标、专利证书,进行版权登记;要密切关注与监测语言产品市场,及时发现市场产品的需求变化,以及竞争对手的发展动向;紧贴语言产品动向与语言技术发展态势,设立预警标杆,既防止自己在语言资源利用与语言产品开发过程中侵犯他人的知识产权,又防止他人侵犯自己语言成果与产品的知识产权;在遭遇侵权行为时,采取正确的策略和措施,积极维权。

所谓“五大手段”,指的是在语言成果与产品遭遇他人侵权时,应当充分利用五大手段进行维权。在数字技术高度发达的今天,越来越多的信息产品所有人开始采用技术措施来保护自己的知识产权。随着美国《千禧年数字版权法》对技术措施合法性的认可,技术措施也成为一种最重要的保护知识产权的方式。我国亦认可技术措施保护知识产权的合法性,因此,权利人要充分利用技术措施保护自己知识产权的优势。此外,还可以通过合同或侵权之诉,以民事诉讼的手段进行救济;申请版权、商标、专利行政主管部门对侵权行为进行制止;对于严重侵害知识产权构成犯罪的行为,则寻求刑事措施救济。同时,在特定情形下,也可以通过合同约定进行仲裁,或者是寻求相关部门调解解决争议。知识产权人应当根据具体情形,充分利用这些手段,构建最佳的保护策略。

2.研究方法

本书主要使用了以下几种具体的研究方法。

规范研究法。针对语言资源与语言成果的特殊性,研究利用不同知识产权分支(专利、商标、版权等)进行保护的法理上的一般原理及法律规范的适用性问题,并对其中语料库、语言博物馆、机器翻译、自然处理技术、语音识别技术等特定领域进行专门研究。

实证研究法。建立针对语言企业及语言产业相关的知识产权数据库,包括主要语言企业的版权数据库、商标数据库以及专利数据库。同时,还建立与语言产业相关的法律数据库、知识产权法律数据库以及一些主要国家知识产权法律数据库,建立语言产业知识产权诉讼纠纷案例数据库。

案例研究法。进入二十一世纪以来,出现了一系列与语言产业有关的知识产权纠纷与诉讼。这些诉讼的出现引发了业界对语言资源与语言成果知识产权保护的关注。本书将研究分析重要的争诉案例,以探索并揭示语言资源知识产权保护的特殊性。

调查研究法。本书也采用实地走访、田野调查的方法,对主要的语言类企业,包括语言服务类企业及语言处理技术类企业进行调研,同时也对从事知识产权保护与监测的机构进行调研,力图了解语言企业对知识产权制度的真实需求,以及知识产权机构研发出来的最新保护、监测手段与措施。

比较研究法。本书还将采用比较研究法:一方面对比不同类型知识产权之间在语言资源与语言成果保护方面的特殊性,另一方面也对不同国家的相关知识产权法律规定进行比较研究。

此外,本书还采用语言结构与语义分析等方法。语言结构与语义分析不仅是语言专业所关注的对象,同时对于知识产权保护也具有十分重要的意义。因为知识产权保护的对象很大一部分就是语言产品。这些不仅是语言专业分析的对象,同时也是决定专利权、商标权保护范围大小强弱的关键因素。可以说,这些也是影响知识产权对语言产品和语言成果保护能力强弱的关键因素。

3.研究框架

本书采用六章式体例,主要包括以下内容:

第一章,绪论。本章首先对语言与知识、语言与权利、语言与产业的发展进行了讨论;然后介绍了我国与其他一些主要国家关于语言的相关法律与政策,以及最新的国际语言人权发展概况;之后对语言与知识产权之间的关系接口进行了讨论,力图构建起全书的论证基础。

第二章,表达形式,即语言中的版权保护。本章集中对语言中的版权问题进行了研究,讨论了语言版权保护的一般原理,其中包括对语言版权保护中的思想/表达二分法、翻译权、汇编权等问题的研究。此外,本章也将对语料库、语言博物馆、字体与字库、语言测试、语言康复业中的版权问题进行专门研究。本章对目前一些典型的与语言有关的版权纠纷案进行讨论,并对重点语言企业的版权分布情况进行分析。

第三章,科技赋能,即语言中的专利布局。本章主要对语言中的专利问题进行研究,讨论语言技术专利实质条件及语言技术专利审查的特别规定,同时对专利侵权中的语言结构、语义分析等方面的技术进行讨论。本章还对语言产业中典型的专利诉讼案例进行分析,并对语言处理技术进行分解,从中选取若干主题词进行专利检索,同时对若干重点语言企业的专利态势进行分析。

第四章,形象认知,即语言中的商业标记。本章集中讨论语言中的商业标记权。本章首先对语言文字商标保护的基本原理进行研究,并对一些特殊标志进行专门研究,同时对专名管理(包括人名、地名、企业名称的管理)也进行了研究,尤其是探讨了这些专名与商标权、域名等知识产权产生冲突时的解决方案。

第五章,语言知识产权保护与监测体系。本章力图构建语言资源与语言产业中的知识产权保护与监测体系。

最后一部分是结语。本章对全书进行了总结,并针对语言产业的特殊性提出进一步完善我国语言知识产权相关法律法规的政策建议,主要包括完善知识产权相关立法、加强监管、提高自身防范能力等。