Skip to content
This repository has been archived by the owner on May 27, 2022. It is now read-only.

Latest commit

 

History

History
158 lines (110 loc) · 3.75 KB

INSTALL.ko.md

File metadata and controls

158 lines (110 loc) · 3.75 KB

설치 가이드

본 문서에서는 Pororo 설치를 위해 필요한 라이브러리에 대한 설명과 설치 방법을 다룹니다.


공통 모듈

  • Pororo 사용을 위해 공통적으로 설치되어야 할 라이브러리는 다음과 같습니다.
  • 해당 라이브러리들은 pip install 명령어를 통해 Pororo가 설치될 때 공통적으로 설치되므로, 추가적인 조치를 취해주지 않으셔도 됩니다.
requirements = [
    "torch==1.6.0",
    "torchvision==0.7.0",
    "pillow>=4.1.1",
    "fairseq>=0.10.2",
    "transformers>=4.0.0",
    "sentence_transformers>=0.4.1.2",
    "nltk>=3.5",
    "word2word",
    "wget",
    "joblib",
    "lxml",
    "g2p_en",
    "whoosh",
    "marisa-trie",
    "kss",
    'dataclasses; python_version<"3.7"',
]

한국어

  • 한국어의 특정 태스크를 수행하기 위해서는 추가적인 라이브러리를 설치할 필요가 있을 수 있습니다.

  • python-mecab-ko한국어 Tokenization, PoS Tagging, Dependency Parsing 등 여러 태스크의 수행을 위해 필요한 라이브러리입니다.

pip install python-mecab-ko==1.0.9
  • kollocate한국어 Collocation 태스크의 수행을 위해 필요한 라이브러리입니다.
pip install kollocate
  • koparadigm한국어 Morphological Inflection 태스크의 수행을 위해 필요한 라이브러리입니다.
pip install koparadigm
  • g2pk한국어 Grapheme-to-Phoneme 태스크의 수행을 위해 필요한 라이브러리입니다.
pip install g2pk

일본어

  • 일본어의 특정 태스크를 수행하기 위해서는 추가적인 라이브러리를 설치할 필요가 있을 수 있습니다.

  • fugashiipadic일본어 RoBERTa 모델의 토크나이즈와 일본어 PoS Tagging을 위해 필요한 라이브러리입니다.

pip install fugashi ipadic
  • romkan일본어 Grapheme-to-Phoneme 태스크의 수행을 위해 필요한 라이브러리입니다.
pip install romkan

중국어

  • 중국어의 특정 태스크를 수행하기 위해서는 추가적인 라이브러리를 설치할 필요가 있을 수 있습니다.

  • g2pM중국어 Grapheme-to-Phoneme 태스크의 수행을 위해 필요한 라이브러리입니다.

pip install g2pM
  • jieba중국어 PoS Tagging 태스크의 수행을 위해 필요한 라이브러리입니다.
pip install jieba

기타

Linux 지원 태스크

  • Automatic Speech Recognition
  • Speech Translation
  • Optical Character Recognition
  • Image Captioning

Automatic Speech Recognition

  • 음성인식 모듈을 활용하기 위해서는 wav2letter 설치가 필요합니다. 레포지토리의 asr-install.sh를 실행함으로써 wav2letter 설치가 가능합니다.
  • Wav2letter를 정상적으로 설치하기 위해서는 CUDA 설치가 선행되어야 합니다.
bash asr-install.sh

Speech Synthesis

  • 음성합성 모듈을 활용하기 위해서는 아래 모듈들을 추가로 설치해주셔야 합니다.
requirements = [
    "editdistance==0.5.3",
    "epitran==1.2",
    "fastdtw==0.3.4",
    "future",
    "jieba==0.42.1",
    "librosa==0.7.0",
    "phonemizer==2.1",
    "Pillow==7.1.0",
    "pinyin==0.4.0",
    "scipy",
    "SoundFile==0.10.2",
    "numba==0.48",
    "ko_pron",
]

Optical Character Recognition

  • OCR 모듈을 활용하기 위해서는 아래 라이브러리들을 설치해주셔야 합니다.
apt-get install -y libgl1-mesa-glx
pip install opencv-python scikit-image