텍스트 전처리에서 유용.

-영어, 숫자를 제외하고 불필요 텍스트 제거.


# 새로운 리스트

list_par = []

# 텍스트를 가지고 있는 리스트

for i in data_list:

    # 영어,숫자 및 공백 제거.

    text = re.sub('[^a-zA-Z0-9]',' ',i).strip()

    # 빈 리스트는 제거.

    if(text != ''):

        list_par.append(text)



+ Recent posts