Python에서 단어 빈도 확인하는 코드

파이썬은 인터프리터 방식의 프로그래밍 언어로, 간결하고 가독성이 높은 문법을 갖추고 있습니다. 게다가 풍부한 라이브러리를 제공합니다. 개방적인 커뮤니티와 활발한 생태계를 보유하고 있어서 많은 분들이 사용하는 언어입니다.

오늘 볼 코드는 텍스트 파일에서 빈도수를 체크하는 코드입니다.

단어의 요수 개수를 세기 위해서, Counter 클래스가 사용되었습니다.

아래 코드 예시 보시면 어렵지 않게 이해가 될것입니다.

온라인에서 한번 실행해 보시는 것도 권해드립니다.

https://www.online-python.com/

물론, 온라인에서 사용하실 때는 파일 open 대신, 문자열을 사용하시면 됩니다.

from collections import Counter

# 입력 파일 이름과 출력 파일 이름
input_file = 'input.txt'
output_file = 'output.txt'

# 단어 빈도를 저장할 Counter 객체 생성
word_counter = Counter()

# 텍스트 파일 읽기
with open(input_file, 'r') as file:
    for line in file:
        # 줄에서 단어 추출
        words = line.split()
        # 단어 빈도 업데이트
        word_counter.update(words)

# 등장 빈도가 5번 이상인 단어 추출
common_words = [word for word, count in word_counter.items() if count >= 5]

# 결과 파일 쓰기
with open(output_file, 'w') as file:
    for word in common_words:
        file.write(f'{word}\n')

위 코드에서 ‘input.txt’ 파일에는 텍스트가 저장되어 있고, ‘output.txt’ 파일에는 등장 빈도가 5번 이상인 단어들이 한 줄에 하나씩 쓰입니다.

필요에 따라 파일 이름을 변경하고, 코드를 실행하여 원하는 결과를 얻을 수 있습니다.

감사합니다.

Leave a Comment