텍스트 전처리에서 유용.
-영어, 숫자를 제외하고 불필요 텍스트 제거.
# 새로운 리스트
list_par = []
# 텍스트를 가지고 있는 리스트
for i in data_list:
# 영어,숫자 및 공백 제거.
text = re.sub('[^a-zA-Z0-9]',' ',i).strip()
# 빈 리스트는 제거.
if(text != ''):
list_par.append(text)
'Study > Code' 카테고리의 다른 글
pickle 파일 읽기 , 저장 (0) | 2018.12.20 |
---|---|
python Image resize 파이썬 이미지 크기조정 (0) | 2018.12.18 |
python np.linalg.norm() / Vector space calculrate Eucildean (0) | 2018.12.11 |
파이썬 이미지 합치기. from PIL import Image (0) | 2018.12.01 |
python 파일 이름 변경. os.rename (0) | 2018.12.01 |