본문 바로가기
데이터 관련/Jieba

Jieba[结巴]-소개

by 준쓰_ 2021. 1. 16.

Jieba 를 소개해보자!!

1일차 요약정리

  • 지에바 패키지를 소개하는 이유
  • 지에바 패키지 github 링크

 

Jieba 패키지

중국어 전공자라면 한번쯤은 들어봤을 Jieba 분석기!

한국의 Konlpy와 같이 중국어 자연어처리할 때 쓰이는 패키지이다

굳이 한국인이 Jieba를 쓸 이유가 있겠냐만은... 아마도 중국을 타겟팅하는 회사가 마케팅할 때 필요하지 않을까 싶다.

한국에서 자연어처리로 감성분석을 수행하듯이 중국어 자연어분석으로 마케팅을 하면 좀 더 효과적이지 않을까.

하지만 한국에서 이것을 가르치거나 전문적으로 소개하는 곳을 보지 못했다.

나도 이런 패키지가 있다라는 것을 수업을 통해 알았지만, '정말 소개하는 정도'였다. (이런 게 있어요!! 정도)

누군가 해주면 좋겠다라고 찾아보는데, 진짜 안보여서 그냥 내가 한다... ㅠㅠㅠ

물론 나는 중국어 못한다. 코딩도 못한다.

하지만 어학전공자가 요새 취업이 쉬운가... 하면 그것도 아니지 않는가.

그래도 전공을 이용해 취직하고 싶고, 또 이용해보고 싶은 사람이 있을 것이다.

때문에 한국사람이 최대한 이용하기 편하게 설명하는 것을 목표로 삼았다.

 

 

Jieba 패키지 소개

내가 주로 다룰 내용은 github에서 结巴中文分词라고 소개되어있는 글이다.

주소는 다음과 같다.

 

fxsjy/jieba

结巴中文分词. Contribute to fxsjy/jieba development by creating an account on GitHub.

github.com

아마도 여기서 나온 내용을 중심으로 소개하고자 하는데...

전문 번역 수준은 안되기에, 혼자 공부하는 정도로만 정리하고자 한다.

(따로 허락은 안구했는데.. 나중에 찾는 사람이 많아지면 해야지!!)

'데이터 관련 > Jieba' 카테고리의 다른 글

Jieba[结巴]-설치  (0) 2021.01.16