最近,学习的过程中需要处理owl文件,我的需求比较简单,不需要用到推理,但是要读取到owl文件中的所有的属性以及属性值。经过在网上大量的搜索和阅读后,发现大部分都是讲如何创建RDF文件后者是owl文件的,或者是获取指定属性名的属性值,并不能够获取owl文件中所有的属性以及属性值。后来通过查看jena的API找到了方法,记录下来一块分享一下。

    为了更好的使用Jena API,我们应该对OWL有个大致的了解。OWL核心是围绕三元组的,即我们在很多资料中看到的陈述(Statement),它的组成为:Statement=(Subject,Property,Object),其中Subject我们熟成为主体,Property成为属性,Object成为客体。在编程中容易让人搞混的他们和Individual的区别。Individual熟称为个体。它是Subject、Object的一个实例,例如在Statement=(Animals,Eat,Plants)陈述中sheep是Animals的一个Individual,grass是Plants的一个Individual。从这个角度上来说我们理解为什么主体、客体被说成是类(Class)。而这一切的主体、客体、个体、类、属性等我们都可以称为资源(Resource)。在编程中OWL常用的是OntModel,Ontclass,OntProperty,Individual。OntClass可以用来创建主体,客体,OntPropety用来创建属性,Individual用来创建个体。 常用的方法有CreatClass,CreatIndividual,listObjects,listObjectsofProperty,listSubjectswithProperty,listPropertyvalues等。

本体文件部分图示:


    我的需求很明确,就是将一个owl文件中的所有的属性名称(包括父节点、子节点)以及相对应的属性值读取出来。接下来直接上代码:

//创建一个本体语言指定语言类型.
	OntModel ontModel = ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);
	try {
		ontModel.read(new FileInputStream("c:/util/owl/symp.owl"), "");
	    } catch (FileNotFoundException e1) {
		e1.printStackTrace();
	    }
		// 迭代显示模型中的类,在迭代过程中完成各种操作
		for (Iterator<?> i = ontModel.listClasses(); i.hasNext();) {
		<span style="white-space:pre">	</span>parentList.clear();
			OntClass c = (OntClass) i.next(); // 返回类型强制转换
			if (!c.isAnon()) {//如果不是匿名类,则打印类的名字
				// 迭代显示当前类的直接父类
				for (Iterator<?> it = c.listSuperClasses(); it.hasNext();){
					OntClass sp = (OntClass) it.next();
				        //得到的id号为obo:SYMP_0000743 因此要去掉obo:因此从3开始截取
	                                parentList.add(sp.getModel().getGraph().getPrefixMapping().shortForm(sp.getURI()).substring(4));
                                 } 
				// 迭代显示当前类的直接子类
				for (Iterator<?> it = c.listSubClasses(); it.hasNext();) {
					OntClass sb = (OntClass) it.next();
	                                childIdBuf.append(sb.getModel().getGraph().getPrefixMapping().shortForm(sb.getURI()).substring(4)+"~");
				}
				StmtIterator iterator = c.listProperties();
				while(iterator.hasNext()){
				<span style="white-space:pre">	</span>Statement statement = iterator.next();
                   <span style="white-space:pre">			</span>predict = statement.getPredicate().toString().substring(statement.getPredicate().toString().indexOf("#")+1);
				        //得到的数据类似encephalitis^^http://www.w3/2001/XMLSchema#string 因此要截取^^之前的部分
                                        //如果不是字符串类型的数据则没有^^这个符号因此符合这个规范的才进行操作
				        object = statement.getObject().toString();
					}

这样就完成了整个的遍历过程。再找到此方法之前,自己尝试过直接使用jena自带的PersistentOntology这个类中的方法直接存入数据库,但是发现他会自动生成好多张表。而且里面有一些数据是不可解释的(可能是我没理解吧),而且属性名前面会加上前缀,不利于进一步进行操作。

     希望对和我有同样困惑的朋友有所帮助!

    

   

更多推荐

利用jena读取owl文件的父子属性以及其他属性