LarKC推理与决策

LarKC: The Large Knowledge Collider ( 大规模知识加速器 ) LarKC Website: http://www.larkc.eu LarKC中文主页: http://cn.larkc.eu •欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模知识加速器,LarKC被设计为一个大规模分布式不完备推理平台。按照LarKC (The Large Knowledge Collider) 项目的起源,其中文可译为大规模知识对撞机,原因是这个名字的由来是受到了欧盟原子能研究组织开发的大规模强子对撞机(Large Hadron Collider)的启发。 •项目开始时间:2008年4月1日 项目结束时间:2011年9月30日 项目时长:42个月 项目经费:约1千万欧元 欧盟委员会资助:约700万欧元 成员单位:13个(来自11个国家) 单位, 80人左右 •如果用简短的话来描述LarKC项目的目的,那便是:基于海量数据的分布式、不完全搜索、推理平台。 •分布式体现在数据集( 目前主要处理的是RDF格式的数据 )分布在万维网、本地等不同的来源。 •不完全体现在“在有限时间内,基于海量数据的确定性推理几乎是不可能的”,因此只能“在不完全数据上进行令用户足够满意的推理”。 •平台则体现在LarKC将与基于语义Web的问题求解组件都以插件的形式组织在一起,通过一个管道(Pipe line)进行调用。 •决策器(/plugins/decider ): 简单范本恒时决策器:一个简单范例,在模板插件集上反复执行工作流,在每个循环结束时返回中间结果(在返回最终结果之前)。 模板决策器:一个用来创建新的决策器插件的简单模板。 … 继续阅读

关于LarKC

一:简要介绍 LarKC: The Large Knowledge Collider ( 大规模知识加速器 ) LarKC 主页:http://www.larkc.eu LarKC中文主页: http://cn.larkc.eu 欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模知识加速器(LarKC,其发音为“lark”),LarKC被设计为一个大规模分布式不完备推理平台。按照LarKC (The Large Knowledge Collider) 项目的起源,其中文可译为大规模知识对撞机,原因是这个名字的由来是受到了欧盟原子能研究组织开发的大规模强子对撞机(Large Hadron Collider)的启发。如果用简短的话来描述LarKC项目的目的,那便是:基于海量数据的分布式、不完全搜索、推理平台。分布式体现在数据集(目前主要处理的是RDF格式的数据)分布在万维网、本地等不同的来源,不完全体现在“在有限时间内,基于海量数据的确定性推理几乎是不可能的”,因此只能“在不完全数据上进行令用户足够满意的推理”,而平台则体现在LarKC将与基于语义Web的问题求解组件都以插件的形式组织在一起,通过一个管道(Pipe line)进行调用。目前在管道中已经考虑的插件类型有:Transformer, Selector, Reasoner, Decider等。正如Cyc 的CTO Michael Witbrock在LarKC的Blog中描述的[http://blog.larkc.eu/?p=1401],“这种体系结构的设计意义在于对于人工智能的研究者来说,当面对基于海量数据的问题求解时,你不需要将任何事情都从头做起”。该平台用于突破语义万维网(Semantic Web)推理系统目前面临的知识处理规模瓶颈。 图 LarKC架构总览 LarKC项目将通过以下几方面的努力实现以上目标: l 扩充现有基于逻辑的语义万维网推理方法:计划通过运用信息检索、机器学习、信息论、数据库、概率推理等学科的理论研发新的推理方法; l 使用受认知科学启发的方法与技术:如传播激活(spreading activation)、注意(attention)、强化(reinforcement)、 习惯(habituation)、关联推理(relevance reasoning)、有限合理性(bounded rationality); … 继续阅读

标记语言综述

注:大部分内容来自w3china.org论坛中ID: fangyuan0809整理的材料, 本人借鉴学习中.http://bbs.w3china.org/dispbbs.asp?boardID=80&ID=86627 摘要: 随着Internet的普及和延伸,标记语言(Markup  Language)得到了迅猛的发展。各种标记语言层出不穷,从SGML到现在互联网上最广泛使用的HTML和用于数据存储与交换、重要数据本身的XML,再到风行一时,用于从HTML到XML标准过渡的XHTML。2000年语义网七层体系结构模型的提出,对标记语言的发展更起到了积极的推动作用。一系列网络本体语言,如RDF(S),XOL、SHOE、DAML+OIL以及OWL的研究得到了显著的进步。鉴于W3C将Semantic Web Services作为未来工作的重点,该文简单介绍了基于语义Web服务的WSDL、RuleML、OWRule+、OWL-S等标记语言。 关键字:标记语言;语义Web;SGML;HTML;XML;OWL   引言 万维网之父蒂姆·伯纳斯·李(Tim Berners-Lee)将万维网的演变分为两个阶段。第一个阶段,万维网应该是一个有利于人们合作的强大工具;第二个阶段,则是蒂姆·伯纳斯·李所定义的语义网阶段。随着Web的发展,用户及开发人员对网络的易用性、友好性提出了更高的要求。目前万维网使用广泛的HTML受制于自身的局限性,越来越不能满足用户需要,加之XHTML2.0计划宣告结束,幸而HTML5给了人们新的希望,HTML5的目标就是要使Web从单纯的内容展示转变成为应用开发平台。另一方面,Web发展的未来是语义的。在这样的语义网中,信息都被赋予了明确的含义,机器能够自动地处理和集成网上可用的信息。语义网使用XML来定义定制的标签格式以及用RDF的灵活性来表达数据,用一种Ontology的网络语言(比如OWL)来描述网络文档中的术语的明确含义和它们之间的关系。各种表示语义的语言得到了着重研究。从RDF(S),DAML+OIL到OWL,从基于语义网服务的OWL-S、 WSDL、SWRL、RuleML、OWRule+等标记语言。  1  标记语言历史 标记语言(Markup Language),也称置标语言,是一种将文本(Text)以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的计算机文字编码。标记只是描述文档的结构和内容(这正是当初提出标记的本意),是在信息文档添加的一种元数据(描述信息的信息),主要包括人们熟知的标签、引用及注释等。标记语言是在文档中添加标记时所采用的规则的集合。标记语言仅表示信息,不参与运算与操作。 “标记(markup)”这个词最早用于出版业,也就是在原稿的边缘加注一些符号来指示打印上的要求。 长久以来,这个工作都是由专门的人(“markup men” )以及校对人来进行,对原稿标志出使用什么样的字体,字型以及字号,然后再将原稿交给其他人进行手工的排版工作。 早在60 年代, 出现了使用描述性标签的描述编码来描述电子文档格式, 其中最具代表性的是IBM 公司发明的GML (Generalized Markup Language, 通用标记语言)。1980 年,ANSI(American National Standards Institute)的CLPT 委员会和GCA和GenCode 委员会在GML 的基础上制定了SGML的草案。1986 年, SGML … 继续阅读