Recent Posts
Recent Comments
Link
- Today
- Yesterday
- Total
메이쁘
[Python3][Pandas] Pandas 로 파일 read 시 UnicodeDecodeError 발생 오류 해결 방법! 본문
Language/Python
[Python3][Pandas] Pandas 로 파일 read 시 UnicodeDecodeError 발생 오류 해결 방법!
메이쁘 2020. 6. 6. 17:19안녕하세요!
위와 같이 pandas.read_csv() 했을 때
UnicodeDecodeError 가 발생하곤 합니다.
이에 대한 해결 방법 바로 적겠습니다.
UnicodeDecodeError ?
-> read 함수의 기본 인코딩 방식이 유니코드(UTF-8) 라서 특정 파일의 한글이 깨지는 오류.
-> 위에 pd.read 할 때 2번 째 패러미터로 encoding 지정하면 됨.
-> 기본 타입 : UTF-8 , 한글 : encoding=“euc-kr” 또는 encoding=“cp949” (권장)
*** euc-kr 은 한글완성형코드(2350자)
*** cp949 는 한글조합형코드(11172자)
*** 그렇기 때문에, euc-kr은 한글조합형코드가 아니라서 ‘믜’ , '뷁' 등 빈도 수가 낮은 문자들은 반영되지 않고 ? 같은 것으로 표시됨.
감사합니다!
좋은 하루 보내세요.
Comments