自即日起知网2002 (HowNet 2002)正式面世。作者现就有关问题做如下说明。
知网2002 (下简称"新版")与知网2000 (下简称"旧版")的异同:
a.新版是旧版的继承和改进,它们在建构的哲学上、理念上是一脉相承的;
b.新版无论在质上还是在词语的量上都有很大的改进,它与旧版的不同具体在于:
- 知网的知识词典描述语言(KDML),从原来的线形的描述方式改进为立体的、可嵌套的描述方式,原来的实体、事件、属性、属性值之间的关系表示从隐性变为显性,有鉴于此,对概念的描述更加准确。
- 对属性和属性值、数量和数量值做了重大的调整。同时对其他义元表也做了相应的调整。
- 新版的浏览器的功能有所增强和丰富,并在浏览器中提供了事件关系与动态角色转换模块。
- 将《中文信息结构库》进行了规则化处理,并针对这些规则编写了相应的解释器。
- 中文词语由旧版的53,000增至60,000;英文词语做了较大的调整,增加英文原文而减少那些仅仅是对中文词语的解释。
为了使大家对知网系统2002版有比较直观的了解,作者在下载中心里提供了知网2002版的演示版和知网2002版的中文词语表,供广大知网支持者和研究者下载。
关于知网2002演示版 知网2002演示版的记录是根据这样的原则抽取的:
- 包含了知网2002完整版的全部单个汉字记录
- 根据知网2002完整版的义元使用情况,每个义元抽取几个记录。
我们把全部的单个汉字记录放在知网2002演示版中是考虑到知网的义元是从四千多个中文汉字中抽取的,因此这些记录可以覆盖知网的全部义元。基于上面的考虑知网2002演示版,虽然记录数少了一些,但是还是可以体现知网2002版的特点。
关于知网2002版中文词语表 知网2002版中文词语表是知网2002完整版的全部中文词语,其词语量为60,000多。我们将会在年底公布知网2002版英语词语表。
作者根据2000年12月7日在中国中文信息学会倡议和主持下召开的"知网2000座谈会"的精神,知网2002版将不再免费提供,而是采用收费式会员制的方式提供给大家。其具体授权方式及价格可通过电子邮件或电话向知网技术支持人员咨询。
知网会在每三个月左右更新一次数据,知网会员可免费获得更新数据。
联系方式:
| 联系人 |
: 郝长伶 |
| 电话 |
: 010-62875641 |
| E-Mail |
: support@keenage.com |
| 地址 |
: 北京市海淀区北四环中路257号科群大厦西楼310室 中国科学院计算语言研究中心语言知识研究室 |
| 邮政编码 |
: 100083 |
|