250x250
Notice
Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 네이버뉴스
- spring MVC(모델2)방식
- mysql
- RESFUL
- tomoto
- Python
- 게시판 만들기
- Gmarket
- Websocket
- 파이썬
- 지마켓
- java
- pytorch
- Topics
- test
- lda
- word2vec
- (깃)git bash
- oracle
- 幼稚园杀手(유치원킬러)
- 방식으로 텍스트
- db
- 과학백과사전
- 코사인 유사도
- 이력서
- 자바
- jsp 파일 설정
- 크롤링
- r
- 토픽추출
Archives
- Today
- Total
무회blog
python: 정규식 예제,test 본문
import re
import pandas as pd
import os, time
from html2text import html2text
from datetime import date
from selenium.webdriver.common.service import _HAS_NATIVE_DEVNULL
today = date.today()
today = str(today)
# str = "I am 12 years old , but he is 5 월 years old."
# # p = re.compile(r'\d+')
# p = re.compile(r'원|세')
# ss = p.findall(str)
# print(len(ss))
# print(today)
# # 경로 체크 하기
patt = 'D:\Src\python\spyder\writeFile\휘경동_parse_2021-03-15.txt'
p = re.compile(r'월세|평|층|구|동')
tts = ""
yuezu = []
pingfang = []
diyu = []
with open(patt,'r',encoding='utf-8') as file:
for line in file.readlines():
rs = p.findall(line)
if(len(rs)> 0 ):
if(rs[0] == '월세'):
if(len(line)<15):
yuezu.append(line)
if(len(rs)> 0 ):
if(rs[0] == '평'):
if(len(line)<15):
pingfang.append(line)
if(len(rs)> 0 ):
if(rs[0] == '구' or rs[0] =='동'):
if(len(line)<10):
diyu.append(line)
dics = {'yuezu': yuezu, 'pingfang':pingfang, 'diyu':diyu}
filename = 'D:\Src\python\spyder\writeFile\휘경동_parse_2021-03-15.xlsx'
df = pd.DataFrame(dics).to_excel(filename)
print(df)
# print('len(yuezu): ' ,len(yuezu))
# print('len(pingfang): ' ,len(pingfang))
# print('len(diyu): ' ,len(diyu))
# print(pingfang)
'Python' 카테고리의 다른 글
html 태그에서 특정 class 속성값이 있으면 1 없으면 0 인 소스를 짠다 .(None/Null 체크) (0) | 2022.06.04 |
---|---|
Anaconda, 설치된 ,라이브러리 확인 (0) | 2022.06.04 |
python:리스트를, 단위별,(7개씩) 자르고, 리스트에 담게 ,split 용 (0) | 2021.03.02 |
python: 지정좌표 클릭, 드래그 (0) | 2021.02.28 |
python:Python利用pandas处理Excel数据 (0) | 2021.02.08 |
Comments