파이썬을 사용하여 구문 분석하려는 다음 XML이 있습니다 ElementTree
.
<rdf:RDF xml:base="http://dbpedia.org/ontology/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns="http://dbpedia.org/ontology/">
<owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague">
<rdfs:label xml:lang="en">basketball league</rdfs:label>
<rdfs:comment xml:lang="en">
a group of sports teams that compete against each other
in Basketball
</rdfs:comment>
</owl:Class>
</rdf:RDF>
모든 owl:Class
태그 를 찾은 다음 그 rdfs:label
안에 있는 모든 인스턴스 의 값을 추출하고 싶습니다 . 다음 코드를 사용하고 있습니다.
tree = ET.parse("filename")
root = tree.getroot()
root.findall('owl:Class')
네임 스페이스로 인해 다음과 같은 오류가 발생합니다.
SyntaxError: prefix 'owl' not found in prefix map
http://effbot.org/zone/element-namespaces.htm 에서 문서를 읽으려고했지만 위의 XML에 중첩 된 네임 스페이스가 여러 개 있기 때문에 여전히이 작업을 수행 할 수 없습니다.
모든 owl:Class
태그 를 찾기 위해 코드를 변경하는 방법을 알려주십시오 .