메이쁘

[Python3][Pandas] Pandas 로 파일 read 시 UnicodeDecodeError 발생 오류 해결 방법! 본문

Language/Python

[Python3][Pandas] Pandas 로 파일 read 시 UnicodeDecodeError 발생 오류 해결 방법!

메이쁘 2020. 6. 6. 17:19

안녕하세요!

 

 

 

 

위와 같이 pandas.read_csv() 했을 때

 

UnicodeDecodeError 가 발생하곤 합니다.

 

 

이에 대한 해결 방법 바로 적겠습니다.

 

 

UnicodeDecodeError ?

  ->  read 함수의 기본 인코딩 방식이 유니코드(UTF-8) 라서 특정 파일의 한글이 깨지는 오류.

 

  ->  위에 pd.read 할 때 2번 째 패러미터로 encoding 지정하면 됨.

 

  ->  기본 타입 : UTF-8 , 한글 : encoding=“euc-kr” 또는 encoding=“cp949” (권장)

 

 

*** euc-kr 은 한글완성형코드(2350)

*** cp949 한글조합형코드(11172)

*** 그렇기 때문에, euc-kr은 한글조합형코드가 아니라서 ’ , '뷁' 빈도 수가 낮은 문자들은 반영되지 않고 ? 같은 것으로 표시됨.

 

 

 

 

감사합니다!

 

좋은 하루 보내세요.

 

 

 

 

 

 

 

Comments