open('master.csv') # 윈도우에서 기본: encoding='cp949'
open('master.csv') # 리눅스에서 기본: encoding='UTF-8'
윈도우에서는 인코딩을 지정해주어야 합니다
lines = open('master.csv').readlines()
# UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 138: illegal multibyte sequence
lines = open('master.csv', encoding='utf-8').readlines()
lines[:10]
import chardet
contents = open('master.csv', 'rb').read()
chardet.detect(contents)
contents = open('rss_30100041.xml', 'rb').read()
chardet.detect(contents)
# 읽기
contents = open('master.csv', 'r', encoding='utf-8').read()
# 쓰기
open('master-euckr.csv', 'w', encoding='euc-kr').write(contents)
contents = open('master-euckr.csv', 'rb').read()
det = chardet.detect(contents)
det
import glob
for fn in glob.glob('*.csv'):
contents = open(fn, 'rb').read()
det = chardet.detect(contents)
print(f"{fn} ({det['encoding']})")
import glob
for fn in glob.glob('*.csv'):
# detect encoding
contents = open(fn, 'rb').read()
det = chardet.detect(contents)
# convert encoding
if str(det['encoding']).lower() == 'utf-8':
text = open('master.csv', 'r', encoding='utf-8').read()
open(fn.replace('.csv', '_euckr.csv'), 'w', encoding='euc-kr').write(text)
윈도우 엑셀은 csv의 기본 인코딩을 cp949(EUC-KR)로 가정
C:\\>chcp 949 # 확장 EUC-KR
C:\\>chcp 65001 # 유니코드 8bit
출처 : https://financedata.notion.site/8c858b09203e4404a3b0d1de426dc078
윈도우 운영체제의 노트북에서는 iPhone 유선 테더링이 잘 안되는 경우가 많습니다. 보통 iPhone의 드라이버가 설치가 안되있어서인…
안녕하세요, 혹시 이런 생각해 본 적 없으신가요? "내가 투자한 회사는 누가 감시하고, 어떻게 운영될까?" 오늘은…
1. Gemini CLI란 무엇인가요? Gemini CLI는 터미널 환경에서 직접 Gemini 모델과 상호작용할 수 있도록 만들어진…
과적합은 머신러닝에서 학습용데이터를 과하게 학습하여, 실제데이터를 예측하지 못하는 현상을 말합니다. 인공지능(AI)의 학습 방법은 우리가 시험공부를…