«parsing» 태그된 질문

구조화되지 않은 데이터를 분석하여 구조화 된 정규화 된 형식으로 변환합니다.

5
csv 형식을 정규식으로 정의 할 수 있습니까?
동료와 나는 최근에 순수 정규 표현식이 csv 형식을 완전히 캡슐화 할 수 있는지 여부를 주장하여 주어진 이스케이프 문자, 인용 문자 및 구분 문자로 모든 파일을 구문 분석 할 수 있습니다. 정규식은 생성 후 이러한 문자를 변경할 수 없지만 다른 경우에는 실패해서는 안됩니다. 나는 이것이 토크 나이저에게는 불가능하다고 주장했다. 이 작업을 …

5
파서 결합기와 함께 별도의 파싱 및 렉싱 패스가 모범 사례입니까?
파서 결합기를 사용하기 시작했을 때 나의 첫 번째 반응은 파싱과 렉싱 사이의 인공적인 구별과 같은 느낌에서 해방 된 느낌이었습니다. 갑자기 모든 것이 파싱되었습니다! 그러나 최근 에이 구별을 복원하는 사람을 보여주는 codereview.stackexchange 에서이 게시물을 발견했습니다. 처음에는 이것이 매우 어리석은 일이라고 생각했지만 Parsec 에이 동작을 지원하기 위해 함수가 존재한다는 사실은 나 자신에게 …

2
컴파일러는 빠른 컴파일 시간을 위해 멀티 스레딩을 사용합니까?
컴파일러 과정을 올바르게 기억하면 일반적인 컴파일러에는 다음과 같은 간단한 개요가 있습니다. 어휘 분석기는 문자별로 소스 코드를 스캔하거나 스캔 기능을 호출 합니다. 입력 문자의 문자열은 룩 셈스 사전과 비교하여 유효성을 검사합니다. Lexeme이 유효한 경우 해당 Lexeme이 해당 토큰으로 분류됩니다. 파서는 토큰 조합의 구문을 검증합니다. 토큰 별 . 이론적으로 소스 코드를 4 …

3
전략 패턴을 사용하는 Java의 일반 파일 파서 디자인
모듈 중 하나의 책임이 XML 파일을 구문 분석하고 필요한 내용을 데이터베이스에 덤프하는 제품을 개발 중입니다. 현재 요구 사항은 XML 파일 만 구문 분석하는 것이지만 향후 모든 종류의 파일을 지원할 수있는 방식으로 구문 분석 모듈을 설계하려고합니다. 이 접근 방식의 이유는 특정 고객을 위해이 제품을 구축하고 있지만 가까운 시일 내에 다른 고객에게 …
14 java  design  parsing  xml 

5
어휘 분석기를위한 토큰 제공
내가 만든 마크 업 언어에 대한 파서를 작성하고 있습니다 (파이썬으로 작성하지만 실제로는이 질문과 관련이 없습니다. 사실 이것이 나쁜 생각처럼 보인다면 더 나은 길에 대한 제안을 좋아합니다) . 파서에 대해 읽고 있습니다 : http://www.ferg.org/parsing/index.html , 나는 lexer를 작성하고 있는데, 올바르게 이해하면 내용을 토큰으로 분할해야합니다. 내가 이해하는 데 어려움이있는 것은 사용해야하는 토큰 …
14 python  parsing  lexer 

2
구문 분석 트리와 추상 구문 트리의 차이점을 설명하는 가장 간단한 예는 무엇입니까?
이해하기 위해 파서는 파싱 트리를 만든 다음 그 트리를 버립니다. 그러나 컴파일러가 사용하는 추상 구문 트리를 표시 할 수도 있습니다. 구문 분석 트리와 추상 구문 트리가 구문 분석 단계에서 생성된다는 인상을 받고 있습니다. 그렇다면 누군가 이것이 왜 다른지 설명 할 수 있습니까?
14 parsing  trees 

5
CSV 파서에 대한 단위 테스트
CSV 파서를 단위 테스트하려면 어떤 테스트를 사용해야합니까? 나는이 간단한의 CSV 파서 C #에서, 그리고 나는 확실히 내가 모든 일반적인 (그리고 드문) 가장자리의 경우 좋은 단위 테스트 커버리지가되고 싶어요. 잠재적 문제와 경계 사례를 식별하기 위해 어떤 테스트를 사용해야합니까?
14 testing  parsing 

2
스캐너리스 파싱은 "Dangling Else Problem"과 어떤 관련이 있습니까?
Dangling Else 문제에 대한 Wikipedia 기사 에서이 문장을 이해하지 못합니다 . [Dangling Else 문제]는 종종 컴파일러 구성, 특히 스캐너리스 구문 분석에서 발생하는 문제입니다. 스캐너리스 파싱 기술이 어떻게이 문제를 악화시킬 수 있는지 설명해 줄 수 있습니까? 문법에 문제가있는 것 같습니다. 모호하기 때문에 구문 분석 기술을 선택하는 것이 아닙니다. 내가 무엇을 놓치고 …

5
회사의 기밀 연구 코드에서 오픈 소스 코드 릴리스를 관리하는 가장 좋은 방법은 무엇입니까?
내 회사 (Acme Technology라고 함)에는 Acme Labs 연구 그룹에서 유래 한 약 1,000 개의 소스 파일 라이브러리가 있으며 개발 그룹에서 몇 년 동안 인큐베이션되었으며 최근에는 소수의 고객에게 제공되었습니다. 비공개. Acme는 코드의 75 %를 오픈 소스 커뮤니티에 공개 할 준비를하고 있습니다. 나머지 25 %는 나중에 출시되지만 현재는 고객이 사용할 준비가되지 않았거나 …

6
사람이 읽을 수있는 가장 간단한 구성 파일 형식은 무엇입니까? [닫은]
폐쇄되었습니다 . 이 질문은 의견 기반 입니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 현재 구성 파일은 다음과 같습니다. mainwindow.title = 'test' mainwindow.position.x = 100 mainwindow.position.y = 200 mainwindow.button.label = 'apply' mainwindow.button.size.x …

2
자연어 처리 구문 분석 된 데이터 유지
최근 Stanford의 CoreNLP를 사용하여 NLP (Natural Language Processing) 실험을 시작했으며 텍스트 마이닝 응용 프로그램과 같은 NLP 구문 분석 데이터를 저장하는 표준 방법이 무엇인지 궁금합니다. 내가 흥미로울 것이라고 생각한 한 가지 방법은 아이들을 인접 목록으로 저장하고 재귀 쿼리를 잘 활용하는 것입니다 (Postgres는 이것을 지원하며 실제로 잘 작동한다는 것을 알았습니다). 그러나 몇 …

3
파서에 문법을 어떻게 지정해야합니까?
나는 몇 년 동안 프로그래밍을 해왔지만 여전히 시간이 오래 걸리는 한 가지 작업은 파서에 문법을 지정하는 것입니다.이 과도한 노력 후에도 내가 생각해 낸 문법이 좋은지 확신 할 수 없습니다 ( 합리적인 "좋은"수단으로). 문법을 지정하는 프로세스를 자동화하는 알고리즘이 있다고 기대하지는 않지만 현재 접근 방식의 많은 추측과 시행 착오를 제거하는 문제를 구조화하는 …

2
평신도의 관점에서, 왼쪽 재귀는 무엇입니까?
code.google.com의 한 페이지 에 따르면 "왼쪽 재귀"는 다음과 같이 정의됩니다. 왼쪽 재귀는 재귀 적 비 터미널을 의미하며, 자체를 포함하는 정서 양식을 생성 할 때 새 자체 사본이 프로덕션 규칙의 왼쪽에 나타납니다. Wikipedia 는 두 가지 정의를 제공합니다. 문맥이없는 문법의 관점에서, r의 생산 ( '대안')에서 가장 왼쪽의 기호가 즉시 (직접 / …

3
HL7 메시지 작업시 어떤 문제가 발생합니까?
건강 관리 사업을위한 제품을 테스트 중이며 HL7 메시지를 사용하고 있습니다. 나는 사람들이 HL7의 문제에 대해 다른 질문에 신음하는 것을 보았지만 구체적인 내용은 언급하지 않았습니다. 누군가 우리가 구체적으로 찾고자하는 문제 나 클래스에 대한 아이디어를 줄 수 있습니까? 구문 분석을 위해 잘 사용되는 라이브러리를 사용하고 있습니다. 이것들이나 우리가하고있는 일에 관한 구체적인 내용이 …
12 testing  parsing  hl7 

2
우선 순위가 동일한 두 개의 이항 연산자가있는 언어, 왼쪽 연관 및 오른쪽 연관
이 이항 연산자 가진 프로그래밍 (또는 스크립트) 언어 (또는 도메인 특정 언어)이 있습니까 opl과 opr의 같은 과 우선 순위를 opl왼쪽으로 연관 되 고 opr마우스 오른쪽 연관되는가? (이러한 예제를 찾을 수는 없지만 이상한 경우를 처리 할 수있는 일반적인 파서를 코딩하려고합니다.) x opl y opr z 또는 x opr y opl z …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.