영어 텍스트의 가독성 측정 도구


13

영어 텍스트가 포함 된 파일을 가져 와서 텍스트를 분석하고 가독성 점수를 출력하는 명령 줄 프로그램이 있습니까?

예를 들어, 프로그램에 텍스트를 공급하면 Flesch-Kincaid 등급 수준, McLaughlin의 SMOG 등급 등을 출력해야합니다.

나는 그러한 프로그램이 공식 저장소에 있다고 생각하지만 그 이름을 기억할 수 없습니다. 내가 잘못 알고있을 가능성도 있습니다.

답변:


11

diction 사전 설치패키지라는 도구를 포함 style:

Style 문서 작성 스타일의 표면 특성을 분석합니다. 다양한 가독성 등급, 단어 길이, 문장 및 단락을 인쇄합니다. 특정 특성을 가진 문장을 추가로 찾을 수 있습니다.

예를 들어, 질문 본문 (파일에 저장 됨 flux_question)을 평가하여 10 이상의 가독성 지수 (ARI)로 문장을 인쇄하는 경우 :

$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
        Kincaid: 10.2
        ARI: 10.8
        Coleman-Liau: 12.5
        Flesch Index: 51.1/100
        Fog Index: 12.0
        Lix: 48.6 = school year 9
        SMOG-Grading: 11.2
sentence info:
        333 characters
        65 words, average length 5.12 characters = 1.65 syllables
        4 sentences, average length 16.2 words
        25% (1) short sentences (at most 11 words)
        0% (0) long sentences (at least 26 words)
        1 paragraphs, average length 4.0 sentences
        25% (1) questions
        25% (1) passive sentences
        longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
        verb types:
        to be (1) auxiliary (2) 
        types as % of total:
        conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
        nominalizations 0% (0)
sentence beginnings:
        pronoun (1) interrogative pronoun (0) article (0)
        subordinating conjunction (0) conjunction (0) preposition (0)

출력을 필터링하려면 예 tail -n8를 들어 성적 만 얻거나 grep 'Flesch\|SMOG'Flesch Index 및 SMOG-Grading을 인쇄하는 데 사용할 수 있습니다 .

$ style style_test | grep 'Flesch\|SMOG'
        Flesch Index: 51.7/100
        SMOG-Grading: 11.2

추가 자료

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.