😆 Big Data/- Data Platform

[pyspark] SyntaxError: 'ascii' codec can't encode character

또방91 2022. 5. 23. 17:34
728x90

 

 

 

 

 

 

SyntaxError: 'ascii' codec can't encode character

 

 

 

 

 

pyspark에서 특수문자를 사용할 경우, 위와 같은 에러가 발생한다.

그리고 csv 내용 중 특수기호가 포함되어있을 경우 df.show( )를 한다면 또 위와 같은 에러가 발생한다.

csv를 불러올 때 encoding 옵션을 설정해서 df를 지정해줘도 오류가 발생한다.

 

 

 

여기서 해결방법은??  간단하다!

도커파일에 파이썬 encoding 환경변수 설정 한줄만 추가하면 된다.

# 파이썬 인코딩 환경변수 설정하기
ENV PYTHONENCODING=utf8

 

 

 

 

쨔잔! program 열 내용중에 하트가 있어도 잘 불러온다! 💜

 

 

 

 

728x90