open('master.csv') # 윈도우에서 기본: encoding='cp949'
open('master.csv') # 리눅스에서 기본: encoding='UTF-8' 윈도우에서는 인코딩을 지정해주어야 합니다
lines = open('master.csv').readlines()
# UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 138: illegal multibyte sequence lines = open('master.csv', encoding='utf-8').readlines()
lines[:10] import chardet
contents = open('master.csv', 'rb').read()
chardet.detect(contents) contents = open('rss_30100041.xml', 'rb').read()
chardet.detect(contents) # 읽기
contents = open('master.csv', 'r', encoding='utf-8').read()
# 쓰기
open('master-euckr.csv', 'w', encoding='euc-kr').write(contents) contents = open('master-euckr.csv', 'rb').read()
det = chardet.detect(contents)
det import glob
for fn in glob.glob('*.csv'):
contents = open(fn, 'rb').read()
det = chardet.detect(contents)
print(f"{fn} ({det['encoding']})") import glob
for fn in glob.glob('*.csv'):
# detect encoding
contents = open(fn, 'rb').read()
det = chardet.detect(contents)
# convert encoding
if str(det['encoding']).lower() == 'utf-8':
text = open('master.csv', 'r', encoding='utf-8').read()
open(fn.replace('.csv', '_euckr.csv'), 'w', encoding='euc-kr').write(text) 윈도우 엑셀은 csv의 기본 인코딩을 cp949(EUC-KR)로 가정
C:\\>chcp 949 # 확장 EUC-KR
C:\\>chcp 65001 # 유니코드 8bit 출처 : https://financedata.notion.site/8c858b09203e4404a3b0d1de426dc078
요양원 선택 전 반드시 확인해야 할 체크리스트를 공개합니다. 공식 평가 자료 조회법, 방문 시 확인…
공공기관 채용 비리의 실태와 피해 지원자의 대응법을 정리했습니다. 채용 비리 신고 방법, 공익신고자 보호제도, 취준생…
주식 손실을 세금 절약에 활용하는 합법적 방법을 공개합니다. 해외주식 손익통산, ISA 계좌 활용, 연금계좌 절세까지…
배달이 예상 시간보다 크게 늦으면 취소·환불을 요청할 수 있습니다. 배달앱별 지연 취소 방법과 잘못 배달됐을…
통신비 절약의 핵심은 요금제 최적화입니다. 내 데이터 사용량 확인법, 알뜰폰 전환 비교, 위약금 없이 요금제…