# 200623-yoyag_test_008-005
import pandas as pd 
import time, timeit, os, sys , re 
from gensim.summarization import summarize
from collections import Counter
import collections
from nltk.tokenize import sent_tokenize,word_tokenize
#############################################
from datetime import datetime
import numpy as np 
import nltk.stem, nltk.corpus, nltk.tokenize 
from newspaper import Article
#############################################
import tomotopy as tp 
#############################################
from gensim import corpora 
from gensim import models
from konlpy.utils import pprint
from kiwipiepy import Kiwi
from konlpy.tag import Hannanum
hannanum = Hannanum()
kiwi = Kiwi()
kiwi.prepare()
#############################################
from string import punctuation
from heapq import nlargest

def resultReturn(text):
    hangul = re.compile('[가-힣]+\.')    # 한글로 포함되다 . 
    
    result = hangul.findall(text) # 정규식에 일치되는 부분을 리스트 형태로 저장, 단어 반환 
    result = list(set(result))    
    for x in result:
#         text = text.replace(x, x + ' \n')
        text = text.replace(x, x + ' ')
    return text

def text_cleaning(text): 
        #이모티콘 제거
        EMOJI = re.compile('[\U00010000-\U0010ffff]', flags=re.UNICODE)
        text= EMOJI.sub(r'', text)
        #이메일 주소 제거
        email =re.compile('([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)')
        text = email.sub('', text) 
        #URL 제거
        url =re.compile('(http|ftp|https)://(?:[-\w.]|(?:%[\da-fA-F]{2}))+')
        text = url.sub('', text) 
        #HTML 제거
        html =re.compile('<[^>]*>')
        text = html.sub('', text) 

        #특수문자를 공백으로 대체(문장을 살리기위헤 마침표는 남겨둠)
        #special =re.compile('[^\w\s]')
        #text = special.sub(' ', text) 
        special= ['*', '{', ',', ':', ']', '$', '+', '[', '#', '(', '%', '&', '}', '`', '‘', '’','·',
                    '=', ';', '>','＞', '/', '"', '“', '”', '\\', '?', '~', "'", '<', ')', '^', '!', '_',
                    '|', '@','@','©','ⓒ', '℗','®','①', '-','▶','…','☞','▲','◆','■'] #'.', 빼고
        for chr in special :
            text=text.replace(chr,' ')
        
        
        ##################################  gensim 사용을 위한 정규표현식 200624
        hangul = re.compile('[가-힣]+\.')      # 한글 + .(점)
        result = hangul.findall(text)          # 정규식에 일치되는 부분을 리스트 형태로 저장
        result = list(set(result))             # 중복제거후 list 로 반환 
        for x in result:
            text = text.replace(x, x + ' ')
            
        text = re.sub('\[.+?\]','', text)         # 대괄호 [] 이내 모든 문자 삭제     
        ##################################  gensim 사용을 위한 정규표현식 200624
        
        #특수문자 제거 후 생기는 중복된 공백 제거
        while text.find('  ') > 0:
            text = text.replace('  ',' ' ) # 중복된 공백 제거

        #특수문자 제거 후 생기는 중복된 개행 제거
        while text.find('\n\n') > 0:
            text = text.replace('\n\n','\n' ) # 중복된 개행 제거
        
        # .텍스트 ->  ".텍스트" -> ". 텍스트"

        #좌우측 공백 삭제
        text = text.strip()

        # 좌측 공백 삭제
        # text.lstrip()

        # 우측 공백 삭제
        #text.rstrip() 

        return text

def textSummerFunc():
    # punctuation는 [, ], ? 등 기호 리스트 이다.
    STOPWORDS =  list(punctuation)

    #문장에 나타나는 단어의 빈도 중 최소, 최대등 의미없는 단어를 제거하기 위한 변수
    MIN_WORD_PROP, MAX_WORD_PROP = 0.1, 0.9

    def compute_word_frequencies(word_sentences):
        words = [word for sentence in word_sentences 
                         for word in sentence 
                             if word not in STOPWORDS]
        counter = Counter(words)
        limit = float(max(counter.values()))
        word_frequencies = {word: freq/limit 
                                    for word,freq in counter.items()}
        # Drop words if too common or too uncommon
        word_frequencies = {word: freq 
                                for word,freq in word_frequencies.items() 
                                    if freq > MIN_WORD_PROP 
                                    and freq < MAX_WORD_PROP}
        return word_frequencies

    def sentence_score(word_sentence, word_frequencies):
        return sum([ word_frequencies.get(word,0) 
                        for word in word_sentence])

    def summarize(text:str, num_sentences=3):
        """
        Summarize the text, by return the most relevant sentences
         :text the text to summarize
         :num_sentences the number of sentences to return
        """
        # Make the text lowercase
        text = text.lower()

        # Break text into sentences 
        sentences = sent_tokenize(text)

        # Break sentences into words
        word_sentences = [word_tokenize(sentence) 
                              for sentence in sentences]

        # Compute the word frequencies
        word_frequencies = compute_word_frequencies(word_sentences)

        # Calculate the scores for each of the sentences
        scores = [sentence_score(word_sentence, word_frequencies)
                         for word_sentence in word_sentences]
        sentence_scores = list(zip(sentences, scores))

        # Rank the sentences
        top_sentence_scores = nlargest(num_sentences, 
                                       sentence_scores,
                                       key=lambda t: t[1])

        # Return the top sentences
        return [t[0] for t in top_sentence_scores]


    #분류 대상 파일을 읽어온다
    ReadDataPd = df2.copy()
    ReadDataPd=ReadDataPd.assign(summarize_word='')
    counter=0
    # for w in ReadDataPd['내용']:
    for w in ReadDataPd['content']:
        #클린징
        ReadDoc_CleanText= text_cleaning(w)
        #print("\nReadDoc_CleanText=",ReadDoc_CleanText[:100])
        # n줄로 요약 생성
        sum_res=summarize(ReadDoc_CleanText, num_sentences=3)

        ReadDataPd.at[counter,'summarize_word']=sum_res
        counter=counter+1
#     path_to = creatFolder_in + td + '_'+ subMenu.strip() + '_' + test_bindo +'_'+ str(most_cnt) + '_textSummerFunc'+'.xlsx'    
#     ReadDataPd.to_excel(path_to)

    return ReadDataPd    

# textSummerFunc()

def gensim_wordSummarize(tts,tts1):
    aa = []
    bb = []
    cc = []
    li_tts = []
    liwd_cnt = []
    tts_cnt = 0        
    for i in range(len(tts)):
        tts_cnt = i
        len(tts[tts_cnt])
        
        ## summary_yoyag 요약 내용을 처리한다 . 
        ttss = ''
        for i in tts[tts_cnt]:
            ttss = ttss + i

        ## yoyag 요약 내용을 처리한다 .
        ttss1 = ''
        for i in tts1[tts_cnt]:
            ttss1 = ttss1 + i
            

        liwd = word_tokenize(ttss)                           #####  gensim 단어 토큰화  
        liwd = [x for x in liwd if len(x) > 2]
        liwd1 = word_tokenize(ttss1)                        #####   naver 단어 토큰화  
        liwd1 = [x for x in liwd1 if len(x) > 2]

        a = Counter(liwd)  # a.most_common  # 빈도수(frequency)가 높은 순으로 상위
        b = Counter(liwd1)
        c = a & b                                                          # 교집합
        c = c.most_common(most_cnt)                                                # 교집합 빈도수 

        if len(liwd) == 0 :
            biyur = 0
        else:
            biyur = round(len(c)/len(liwd),2)*100
            biyur = int(biyur)
        biyur = str(biyur) + '%'                 #  네이버요약 기준 , gensim 단어 매칭 비율 


        ## a | b #  합집합에 대한 내용 
        aa.append(a.most_common(3))   # 상위 몇개 빼기 
        bb.append(b.most_common(3))

        liwd_cnt.append(biyur)

        cc.append(len(c))           # 교집합 빈도수 
        li_tts.append(c)

    # df2['요약_단어빈도교집합']  = li_tts
    df2['요약단어_교집합']   = li_tts
    df2['naver_단어빈도']    = aa
    df2['gensim_단어빈도']   = bb
    df2['단어_빈도수']       = cc
    df2['빈도_비율']         = liwd_cnt

    df3 = df2.copy()
    
    df3['단어매칭율'] = pd.to_numeric(df3['빈도_비율'].str.replace('%',''))
#     df3['단어매칭율'] = str(df3['단어매칭율'].mean()) + '%'   # pd.options.display.float_format = '{:.2f}'.format
    df3['단어매칭율'] = str(round(df3['단어매칭율'].mean(),2)) + '%'
    
    for i in range(len(df3['요약단어_교집합'])):
        if len(df3['요약단어_교집합'][i]) == 0 :
               df3['요약단어_교집합'][i] = '무'
        else:
               pass    
################################################################################################            
#     df3['yoyag'] = df3['yoyag'].str.replace('[가-힣]+\.{1}','.+\n', regex = True)
    li_text = df3['yoyag'].tolist() 
    li_text2 = [resultReturn(text) for text in li_text]
    df3['yoyag'] = li_text2
################################################################################################
    df3 = df3[['subMenu','title','yoyag','summary_yoyag','naver_단어빈도','gensim_단어빈도','요약단어_교집합','빈도_비율','단어_빈도수','단어매칭율']]
#     df3 = df3[['subMenu','title','yoyag','summary_yoyag','단어매칭율']]

    # df3 = df3.sort_values(by=['단어_빈도수'], axis = 0, ascending = False)  ## ascending 정렬  교집합 
#     df3 = df3.sort_values(by=['빈도_비율'], axis = 0, ascending = False)  ## ascending 정렬   빈도율

    path_to = creatFolder_in + td + '_'+ subMenu.strip() + '_' + test_bindo +'_'+ str(most_cnt)+'_gensim_wordSummarize' +'.xlsx'    
    df3.to_excel(path_to)
    
    
    path=creatFolder_in               
    path=os.path.realpath(path)
    os.startfile(path)
    
    return df3

def summary_wordSummarize(tts,tts1):
    aa = []
    bb = []
    cc = []
    li_tts = []
    liwd_cnt = []
    tts_cnt = 0        
    for i in range(len(tts)):
        tts_cnt = i
        len(tts[tts_cnt])
        ttss = ''
        for i in tts[tts_cnt]:
            ttss = ttss + i

        ttss1 = ''
        for i in tts1[tts_cnt]:
            ttss1 = ttss1 + i

        liwd = word_tokenize(ttss)                           #####  gensim 단어 토큰화  
        liwd = [x for x in liwd if len(x) > 2]
        liwd1 = word_tokenize(ttss1)                        #####   naver 단어 토큰화  
        liwd1 = [x for x in liwd1 if len(x) > 2]

        a = Counter(liwd)  # a.most_common  # 빈도수(frequency)가 높은 순으로 상위
        b = Counter(liwd1)
        c = a & b                                                          # 교집합
        c = c.most_common(most_cnt)                                                # 교집합 빈도수 

        if len(liwd) == 0 :
            biyur = 0
        else:
            biyur = round(len(c)/len(liwd),2)*100
            biyur = int(biyur)
        biyur = str(biyur) + '%'                 #  네이버요약 기준 , gensim 단어 매칭 비율 


        ## a | b #  합집합에 대한 내용 
        aa.append(a.most_common(3))   # 상위 몇개 빼기 
        bb.append(b.most_common(3))

        liwd_cnt.append(biyur)

        cc.append(len(c))           # 교집합 빈도수 
        li_tts.append(c)

    # df2['요약_단어빈도교집합']  = li_tts
    txdf['요약단어_교집합']   = li_tts
    txdf['naver_단어빈도']    = aa
    txdf['txdf_단어빈도']     = bb
    txdf['단어_빈도수']       = cc
    txdf['빈도_비율']         = liwd_cnt

    df3 = txdf.copy()
    df3['단어매칭율'] = pd.to_numeric(df3['빈도_비율'].str.replace('%',''))
    df3['단어매칭율'] = str(df3['단어매칭율'].mean()) + '%'
    
    df3 = df3[['subMenu','title','yoyag','naver_단어빈도','summarize_word','txdf_단어빈도','요약단어_교집합','빈도_비율','단어_빈도수','단어매칭율']]

    for i in range(len(df3['요약단어_교집합'])):
        if len(df3['요약단어_교집합'][i]) == 0 :
               df3['요약단어_교집합'][i] = '무'
        else:
               pass
    # df3 = df3.sort_values(by=['단어_빈도수'], axis = 0, ascending = False)  ## ascending 정렬  교집합 
#     df3 = df3.sort_values(by=['빈도_비율'], axis = 0, ascending = False)  ## ascending 정렬   빈도율
    path_to = creatFolder_in + td + '_'+ subMenu.strip() + '_' + test_bindo +'_'+ str(most_cnt)+'_summary_wordSummarize' +'.xlsx'    
    df3.to_excel(path_to)
    
    path=creatFolder_in               
    path=os.path.realpath(path)
    os.startfile(path)    
    
    return df3

# 최종 쓰기경로찾기 
path = './yoyag_test/'
checkFolder = os.path.isdir(path)

creatFolder_in = path

if checkFolder == True:
    pass
else:
    os.mkdir(creatFolder_in)

############ 폴더 생성 및 체크 
tdd = datetime.today().strftime("%m%d")
checkFolder = os.path.isdir('./yoyag_test/'+'20'+tdd + '/')
creatFolder_in = './yoyag_test/'+'20'+tdd + '/'

if checkFolder == True:
    pass
else:
    os.mkdir(creatFolder_in)

# 최종 읽기경로찾기  읽기 경로   
td = datetime.today().strftime("%Y%m%d")     # 오늘 일자  
path_dir = './news002/quanbu/'
path_list = os.listdir(path_dir)
path = path_dir +  path_list[0]

subMenu    = ''                              # 타겟 메뉴 
sheet_cnt  = 0                               # 0 - 5 , 통합, 정치, 경제, 사회, 생활, 세계, it 
most_cnt   = 20                              #  상위 교집합의 갯수 기준 테스트 

test_bindo = '빈도_비율'                     #  빈도_비율,   # 단어_빈도수   ,(교집합 테스트)
# test_bindo = '단어_빈도수'                 #  빈도_비율,   # 단어_빈도수   ,(교집합 테스트)
# test_ratio = 0.5                             # 30% 의 비율로 요약 요청 
test_wordCnt =  40                             # 단어수 20개로 지정  , St_wordCnt 대체로 큰 의미 없음, 파일명 지정 가능
df = pd.read_excel(path, sheet_name=sheet_cnt)
print(path)

df1 = df.copy()
df2 = df1[['subMenu','title','content','yoyag']]
##################################################################################################
li_summary = []  
chk = 0
pd.set_option('mode.chained_assignment',  None) # <==== 경고를 끈다    
# ################################################### test001 요약단어_교집합 , gensim_단어요약 VS naver_단어요약
cnt_li = df2['content'].tolist()
subMenu  = df2['subMenu'][0]
print(subMenu)

for i in cnt_li:
    chk = chk + 1
    output = text_cleaning(i)

#     TotalWord = 단어수 세서 넣고
    TotalWord = word_tokenize(output)
    TotalWord_cnt = len(TotalWord)
#     print(TotalWord_cnt)

#     TotalLine = 스플릿 해서 넣고   # text_cleaning
    TotalLine = output.replace('. ','. _').split('_')                      # 한글 + .(점) 기준 줄바꿈처리, 줄바꿈기준 짜르기 
    TotalLine_cnt = len(TotalLine)
#     print(TotalLine_cnt)
#     print(TotalLine)
    
#     문장당 단어수 = (TotalWord/TotalLine) * 3.2    
    St_wordCnt = (TotalWord_cnt/TotalLine_cnt) * 3.2
    St_wordCnt = int(St_wordCnt)                                
    
#     output = summarize(output1,ratio=St_wordCnt)                           ## test_ratio
    output = summarize(output,word_count = St_wordCnt)                   ##  정제된 데이터(content)로 문장을 요약한다. 

    li_summary.append(output)
df2['summary_yoyag'] = pd.Series(li_summary)
df2
tts = df2['summary_yoyag'].tolist()
tts1 = df2['yoyag'].tolist()
####################################################################### test002 요약단어_교집합 , summary_단어요약 VS naver_단어요약
txdf      = textSummerFunc()                       # summarrize 함수를 사용 
tts0      = txdf['summarize_word'].tolist()
tts01     = txdf['yoyag'].tolist()
subMenu   = txdf['subMenu'][0]

####################################################################### 
# summary_wordSummarize(tts0,tts01)  


gensim_wordSummarize(tts,tts1)

./news002/quanbu/200624-news_100.xlsx
정치

# import re

# text = """
# [서울=뉴시스]김태년 민주당 원내대표는 24일 오전 국회에서 열린 소재·부품·장비 산업 현안점검회의에서 "법원이 전범기업에 대한 국내자산 매각 절차를 감행하면서 일본이 두 자릿수 추가 보복조치를 예고한 상태"라면서 "지금부터 가능한 시나리오를 검토하고 가능한 방안을 미리 만들어야 한다.가가가'소부장 전략 2'를 추진하겠다"고 말했다.그는 그간의 일본수출규제 대응 성과와 관련해선 "불화수소 등 수출 규제 품목에 대해선 수입 다변화를 이뤄냈고 소부장 산업정책을 체계적으로 마련해왔다"고 평가했다.aaa그러면서 "'포스트 코로나 대응을 위해서도 더욱 속도감있게 정책을 추진해야한다"면서 "바이오, 미래차 등 신산업이 발전하려면 소부장이 뒷받침돼야 한다. '한국판 뉴딜'을 위해서라도 필수적"이라고 강조했다.AAA조정식 민주당 정책위의장은 "20년 만에 전면 개정된 소부장 특별법을 차질없이 시행했고 올해 2조6000억원의 예산을 투입하고 있다"면서 "올해부터 소부장 정책이 본격 추진되는 만큼 민주당은 소부장 경쟁력 강화를 적극 진행하겠다"고 말했다"이어 "산업통상자원부는 특정국가 의존도 완화를 위한 기술자립, 첨단산업화를 해주시고 과학기술정보통신부는 소부장 연구개발(R&D) 고도화 대책을 마련해주시길 바란다"면서 "중소벤처기업부는 인력양성과 일본의 추가 보복조치시 중소기업의 피해를 최소화하기 위한 대책을 빈틈없이 마련해주시길 바란다"고 당부했다.123
# """

# # def resultReturn(text):
# #     hangul = re.compile('[가-힣]+\.')    # 한글로 포함되다 . 
    
# #     result = hangul.findall(text)         # 정규식에 일치되는 부분을 리스트 형태로 저장, 단어 반환 
# #     result = list(set(result))    
# #     text2 = text
# #     for x in result:
# #         text2 = text2.replace(x, x + ' \n')

# #     return text2 
    
# # resultReturn()    




# # string = 'text [text] text (text) text'
# # regex = re.compile('\(.+?\)')                # 괄호 () 이내 모든 문자 삭제 
# # regex = re.compile('\[.+?\]')                # 대괄호 [] 이내 모든 문자 삭제 
# # output = regex.sub('', string)

# text = re.sub('\[.+?\]','', text)         # 대괄호 [] 이내 모든 문자 삭제 

# print(text)

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

	subMenu	title	yoyag	summary_yoyag	naver_단어빈도	gensim_단어빈도	요약단어_교집합	빈도_비율	단어_빈도수	단어매칭율
0	정치	오세훈 “김종인 대권설? 나이가 무슨 상관… 가능성 있어”	미래통합당 김종인 비상대책위원장이 대권 후보로 백종원 더본코리아 대표를 거명한 것과...	미래통합당 김종인 비상대책위원장이 대권 후보로 백종원 더본코리아 대표를 거명한 것과...	[(후보로, 2), (백종원, 2), (대표를, 2)]	[(백종원, 2), (가능성도, 2), (미래통합당, 1)]	[(백종원, 2), (미래통합당, 1), (김종인, 1), (비상대책위원장이, 1)...	47%	20	34.58%
1	정치	일본 2차보복 가능성에 당·정 "소부장 강화 더 속도감 있게 추진"(종합)	일본 강제징용 기업에 대한 법원의 국내 자산 매각 절차 돌입으로 추가 무역 보복 조...	김태년 소부장 대책 추진 현안 점검해야 소부장 산업 전략 시즌2 시작 조정식 일본발...	[(소부장, 5), (김태년, 2), (당정이, 2)]	[(조치가, 2), (소재·부품·장비, 2), (소부장, 2)]	[(소부장, 2), (당정이, 1), (더불어민주당, 1), (24일, 1), (국...	28%	16	34.58%
2	정치	김태년·주호영 강원 사찰서 극적 회동…원 구성 협상 이견 여전	김태년 더불어민주당 원내대표와 주호영 미래통합당 원내대표가 23일 극적인 '사찰 회...	김태년 국회 정상화 노력 vs 주호영 새 제안 없어 與 오는 26일 국회 정상화 방...	[(김태년, 3), (주호영, 3), (정상화, 2)]	[(통합당이, 2), (원내대표는, 2), (김태년, 1)]	[(김태년, 1), (주호영, 1), (더불어민주당, 1), (미래통합당, 1), ...	33%	13	34.58%
3	정치	국방부, 26일 대구·경북 통합신공항 부지선정 실무위 개최	국방부는 오는 26일 대구·경북 통합신공항 이전부지 선정실무위원회에 이어 내달 3일...	특히 선정 기준과 관련해서는 유치 신청된 각 후보지가 작년 11월 27일 제5회 선...	[(주민투표, 2), (기준과, 1), (관련해서는, 1)]	[(이전부지, 2), (후보지별로, 2), (검토한다, 2)]	[(기준과, 1), (관련해서는, 1), (신청된, 1), (후보지가, 1), (1...	45%	19	34.58%
4	정치	태영호 “정상국가 맞지 않는 비상식”…유엔 북한 인권결의 불참 비판	북한 고위 외교관 출신의 태영호 미래통합당 의원은 24일 우리나라가 유엔 산하 인권...	연합 헤럴드경제 이원율 기자 북한 고위 외교관 출신의 태영호 미래통합당 의원은 24...	[(정상적, 2), (행위를, 2), (헤럴드경제, 1)]	[(의원은, 2), (북한인권, 2), (않기로, 2)]	[(정상적, 2), (외교관, 1), (출신의, 1), (태영호, 1), (미래통합...	45%	20	34.58%
5	정치	정경두 장관, 한국전 참전국 국방장관에 감사 서신	국방부는 24일, 정경두 국방부 장관이 한국전쟁 발발 70주년을 맞아 참전국 국방장...	한국의 담대한 여정 지지해달라 당부 오마이뉴스 김도균 기자 정경두 국방부 장관...	[(담대한, 2), (정경두, 2), (국방부, 2)]	[(한국전쟁, 2), (70주년을, 2), (국방부는, 1)]	[(담대한, 1), (정경두, 1), (국방부, 1), (국방부는, 1), (24일...	34%	20	34.58%
6	정치	김정은, 대남 군사행동계획 보류…"긴장국면 일단 숨고르기"	북한 김정은 위원장이 지난 23일 노동당 중앙군사위원회 7기 5차 회의 예비회의를 ...	김정은 북한 국무위원장 조선중앙통신 연합뉴스 북한 김정은 위원장이 지난 23일 노동...	[(김정은, 3), (예비회의를, 2), (보류했다, 2)]	[(김정은, 1), (위원장이, 1), (23일, 1)]	[(김정은, 1), (위원장이, 1), (23일, 1), (노동당, 1), (중앙군...	19%	8	34.58%
7	정치	육군 부사관 모집에 '근무일과 근무시간 협의 가능’ 광고로 물의	육군이 부사관 모집광고를 알바천국에 올렸다. 이 과정에서 근무일과 근무시간 협의가 ...	경향신문 알바천국 캡처육군이 부사관 모집광고를 알바천국에 올렸다.\n알바천국에 올라...	[(부사관, 4), (모집광고를, 3), (알바천국에, 2)]	[(알바천국에, 2), (육군이, 1), (부사관, 1)]	[(알바천국에, 2), (부사관, 1), (모집광고를, 1)]	9%	3	34.58%
8	정치	美 "北핵활동 지속, 검증된 비핵화 달성까지 제재 변화 없다"	미 국무부는 23일 북한의 핵 활동이 지속되고 있다며 '최종적이고 완전하게 검증된 ...	2015년 촬영된 영변 핵단지에서 무기급 플루토늄 제조를 위해 사용후 연료봉을 만드...	[(원자로, 2), (국무부는, 2), (군비통제, 2)]	[(국무부는, 2), (달성할, 2), (때까지, 2)]	[(국무부는, 2), (따르면, 1), (연방의회에, 1), (제출한, 1), (북...	30%	19	34.58%
9	정치	당정 "일본이 두 자릿수 추가보복 예고…'소부장 전략 2.0' 추진"	더불어민주당과 정부가 일본의 추가 무역수출규제에 대비해 '소재?부품?장비 산업 육성...	최기영 과기부 장관은 내년도 R D투자는 올해 1.7조원보다 더욱 확대될 것으로 보...	[(소부장, 3), (말했다, 3), (장관은, 2)]	[(더불어민주당과, 1), (정부가, 1), (일본의, 1)]	[(소부장, 1)]	2%	1	34.58%
10	경제	“풀무원, 2분기 실적 컨센서스 상회 전망...목표가↑”-대신증권	대신증권은 24일 풀무원에 대해 "올해는 해외 사업부의 턴어라운드, 내년은 국내 푸...	한유정 연구원은 2020년 2분기 풀무원의 연결 매출액은 6161억원 영업이익은 1...	[(영업이익, 2), (한유정, 1), (연구원은, 1)]	[(것으로, 4), (사업부의, 2), (상회할, 2)]	[(연구원은, 1), (2분기, 1), (상회할, 1), (이라고, 1), (푸드서...	24%	9	34.58%
11	경제	[빅데이터MSI]24일 오전 주식시장 심리 4단계 '보통'	24일 오전 빅데이터로 분석한 주식시장 코스피 200종목의 시장심리지수는 4단계 '...	서울 뉴시스 류병화 기자 24일 오전 빅데이터로 분석한 주식시장 코스피 200종목의...	[(MSI, 4), (코스피, 2), (거래일, 2)]	[(코스피, 2), (거래일, 2), (MSI, 2)]	[(코스피, 2), (MSI, 2), (거래일, 2), (레벨은, 2), (24일,...	49%	20	34.58%
12	경제	e편한세상 시티 부평역, 평균 청약경쟁률 7.47대 1로 청약 마감	삼호와 대림코퍼레이션은 인천광역시 부평구 부평동 일원에 선보이는 'e편한세상 시티 ...	디지털타임스 이상현 기자 삼호와 대림코퍼레이션은 인천광역시 부평구 부평동 일원에 선...	[(e편한세상, 3), (부평역, 2), (디지털타임스, 1)]	[(삼호와, 1), (대림코퍼레이션은, 1), (인천광역시, 1)]	[(삼호와, 1), (대림코퍼레이션은, 1), (인천광역시, 1), (부평구, 1)...	54%	20	34.58%
13	경제	이디야커피, 여름 시즌 맞춰 텀블러·워터보틀 출시	이디야커피가 청량한 여름의 계절감을 살려 디자인한 MD 신제품을 출시했다. 쿨 워터...	이데일리 송주오 기자 이디야커피가 청량한 여름의 계절감을 살려 디자인한 MD 신제품...	[(신제품을, 2), (있도록, 2), (이데일리, 1)]	[(신제품을, 2), (있도록, 2), (이디야커피가, 1)]	[(신제품을, 2), (있도록, 2), (이디야커피가, 1), (청량한, 1), (...	54%	20	34.58%
14	경제	[Hot-Line] "NAVER, 지속 성장과 리레이팅…목표가↑"	한화투자증권은 24일 NAVER에 대해 폭발적 성장세와 수익모델 확장으로 멀티플 리...	한화투자증권은 24일 NAVER에 대해 폭발적 성장세와 수익모델 확장으로 멀티플 리...	[(수익모델, 2), (확장으로, 2), (멀티플, 2)]	[(수익모델, 2), (확장으로, 2), (멀티플, 2)]	[(수익모델, 2), (확장으로, 2), (멀티플, 2), (지속될, 2), (한화...	37%	20	34.58%
15	경제	롯데건설, ‘노원 롯데캐슬 시그니처’ 7월 분양	롯데건설은 오는 7월 서울시 노원구 상계6구역을 재개발한 '노원 롯데캐슬 시그니처'...	전용면적 21 97㎡ 총 1163가구 중 721가구 일반분양4호선 상계역 역세권 동...	[(전용면적, 2), (97㎡, 2), (1163가구, 2)]	[(롯데건설은, 1), (서울시, 1), (노원구, 1)]	[(롯데건설은, 1), (서울시, 1), (노원구, 1), (상계6구역을, 1), ...	28%	10	34.58%
16	경제	"LG생활건강, 면세 채널 부진으로 실적 하향 전망…목표가↓"-DB금융투자	DB금융투자는 24일 LG생활건강에 대해 면세 채널 부진이 심화되면서 실적 컨센서스...	투자의견 매수 유지 목표주가 168만원으로 하향LG생활건강 투자지표 변동 추이 DB...	[(화장품, 2), (부문에서는, 2), (효과가, 2)]	[(DB금융투자는, 1), (24일, 1), (LG생활건강에, 1)]	[(168만원으로, 1), (24일, 1), (LG생활건강에, 1), (부진이, 1...	32%	20	34.58%
17	경제	쿠팡, 테크 직군 200여명 경력 공채…사이닝 보너스 최소 5000만원	쿠팡이 테크직군 경력 공채에 나선다. 쿠팡은 안드로이드, iOS, Frontend,...	디지털타임스 김아름 기자 쿠팡이 테크직군 경력 공채에 나선다.\n쿠팡은 안드로이드 ...	[(쿠팡은, 2), (엔지니어, 2), (프로덕트, 2)]	[(엔지니어, 2), (프로덕트, 2), (경력직, 2)]	[(엔지니어, 2), (프로덕트, 2), (쿠팡이, 1), (테크직군, 1), (공...	33%	19	34.58%
18	경제	SBI저축은행 사이다뱅크, 네이버페이 서비스 오픈	SBI저축은행이 저축은행 업계 최초로 네이버페이와 전자금융결제 제휴를 맺고 신규서비...	SBI저축은행서비스 이용을 원하는 고객은 네이버페이에서 SBI저축은행 모바일 플랫폼...	[(간편결제, 3), (SBI저축은행, 2), (사이다뱅크, 2)]	[(SBI저축은행이, 1), (저축은행, 1), (최초로, 1)]	[(이용을, 1), (원하는, 1), (고객은, 1), (네이버페이에서, 1), (...	39%	13	34.58%
19	경제	‘호텔 델루나’ 미국서 리메이크...美스카이댄스와 첫 프로젝트	드라마 '호텔 델루나'가 미국에서 TV 시리즈로 제작된다. 스튜디오드래곤과 美 제작...	스튜디오드래곤 X 스카이댄스 호텔 델루나 TV시리즈 공동 기획 제작 계약 체결...	[(델루나, 3), (스카이댄스, 2), (TV시리즈, 2)]	[(드라마, 2), (제작사, 2), ('호텔, 1)]	[(델루나, 1), (스카이댄스가, 1), (스카이댄스와, 1), (ENM과, 1)...	36%	14	34.58%
20	사회	인천시, 스마트도시 계획 발표...혁신·균형·경제·안심·열린도시	인천시는 4차 산업혁명 관련 첨단 정보통신기술을 활용해 '인천시 스마트도시계획'을 ...	이번 도시계획은 지난해 계획 단계부터 인천시민들이 참여해 설문조사 스마트도시 시민참...	[(스마트도시, 3), (도시계획은, 1), (지난해, 1)]	[(스마트도시, 2), (인천시는, 1), (산업혁명, 1)]	[(스마트도시, 2), (목표와, 1), (10개, 1), (추진전략이, 1), (...	53%	20	34.58%
21	사회	온실가스 배출 1/10로 감축…친환경 소재 재활용기술 주목	재료연구소는 금속재료연구본부 마그네슘연구실 문병기 박사 연구팀이 환경부의 '2020...	마그네슘 스크랩의 재활용 과정에 난연성 마그네슘 합금 기술 을 적용 용해 및 정...	[(마그네슘, 3), (재활용, 2), (난연성, 2)]	[(마그네슘, 3), ('난연성, 2), (재료연구소는, 1)]	[(마그네슘, 3), (스크랩의, 1), (재활용, 1), (과정에, 1), (과정...	28%	16	34.58%
22	사회	자전거 도로 시설 점검, 시민이 직접 살핀다	서울 지역의 민간 자전거 단체를 중심으로 구성된 '자전거 안전 지킴이단'이 출범된다...	서울시는 24일 올림픽공원 평화의 문 앞에서 자전거 안전 지킴이단의 홍보 캠페인을 ...	[(자전거, 5), (서울시는, 2), (올림픽공원, 2)]	[(자전거, 2), (지역의, 1), (단체를, 1)]	[(자전거, 2), (24일, 1), (올림픽공원, 1), (평화의, 1), (앞에...	24%	10	34.58%
23	사회	계명대 최재백 학생, 학교에 마스크 1만장 기부	계명대 휴학생인 최재백씨가 22일 재학생들을 위해 써 달라며 마스크 1만장을 학교에...	계명대 휴학생인 최재백 우측 두번째 씨가 22일 재학생들을 위해 써 달라며 마스크 ...	[(계명대, 3), (휴학생인, 2), (최재백, 2)]	[(계명대, 1), (휴학생인, 1), (최재백씨가, 1)]	[(계명대, 1), (휴학생인, 1), (22일, 1), (재학생들을, 1), (달...	30%	14	34.58%
24	사회	달리던 택배 차량서 불났다...일부 물품은 불타	달리던 택배 차량에서 불이 나 실려 있던 택배 물품이 일부 소실되는 피해가 발생했다...	오전 인천 서운나들목 부근물에 젖기도 5000만원 피해달리던 택배 차량에서 불이 나...	[(피해가, 2), (당국은, 2), (것으로, 2)]	[(달리던, 2), (차량에서, 1), (물품이, 1)]	[(차량에서, 1), (물품이, 1), (소실되는, 1), (피해가, 1)]	11%	4	34.58%
25	사회	오늘 전국 장마 시작…내일 낮까지 비, 곳곳 천둥·번개·돌풍	수요일인 24일에 본격적인 장마가 시작되겠다. 기상청은 이날 "새벽에 서해안부터 비...	기상청은 이날 새벽에 서해안부터 비가 시작돼 낮에는 전국으로 확대되겠다 며 내일 2...	[(기상청은, 1), (새벽에, 1), (서해안부터, 1)]	[(12시부터, 2), (있겠다, 2), (수요일인, 1)]	[(새벽에, 1), (서해안부터, 1), (시작돼, 1), (낮에는, 1), (전국...	27%	11	34.58%
26	사회	인천공항 '떼쓰면 정규직'…역차별 논란 불붙이는 언론	22일 인천국제공항공사가 협력 업체 소속 보안검색 요원 1900명을 공사의 직고용 ...	조선일보는 1면 기사에서 특히 인천공항공사 비정규직 직원들 간 채팅으로 추정되는 카...	[(조선일보는, 1), (기사에서, 1), (인천공항공사, 1)]	[(정규직, 2), (인천공항, 2), ('연봉, 2)]	[(비정규직, 1), (정규직, 1), (세계일보, 1), (한겨레, 1), (한국...	26%	8	34.58%
27	사회	“마스크 안 썼다” 승차거부에 버스기사 폭행…가해자도 버스기사	마스크를 쓰지 않아 승차 거부를 당한 승객이 택시까지 타고 버스를 쫓아가 버스기사를...	A씨는 지난 20일 오전 0시 20분쯤 포천시 선단동의 한 버스 정류장 종점에서 6...	[(A씨는, 3), (포천시, 2), (종점에, 2)]	[(마스크를, 1), (거부를, 1), (승객이, 1)]	[(버스기사, 1), (버스를, 1), (택시까지, 1), (휘두른, 1), (것으...	13%	5	34.58%
28	사회	대구 삼화식품 '내부고발 자작극' 점입가경…노조, "경찰이 기획" 폭로 예고	직원들이 전직 간부의 배후조종으로 회사의 치명상을 입힐 수 있는 약점을 일부러 꾸며...	반품 재활용 경찰 제보한 직원들 거짓 진술 양심고백 배후조종 지목 전직간부 공갈미수...	[(24일, 2), (재활용, 1), (제보한, 1)]	[(삼화식품의, 2), (직원들이, 1), (간부의, 1)]	[(24일, 1), (직원들이, 1), (간부의, 1), (배후조종으로, 1), (...	34%	18	34.58%
29	사회	서부경남 '공공병원 신설'에 압도적 비율, 후보지는?	두 차례 열린 '서부경남 공공의료 확충 공론화' 도민토론회에서 도민참여단들이 압도적...	오는 27일 3차 토론에서 후보지 논의 오마이뉴스 윤성효 기자 서부경남 공공의료 ...	[(공공병원, 3), (27일, 2), (토론에서, 2)]	[('서부경남, 2), (공공의료, 2), (공론화, 2)]	[(공공의료, 2), (공론화, 2), (27일, 1), (토론에서, 1), (후보...	47%	15	34.58%
30	생활_문화	모바일 운전면허증, CU·GS25 신분증으로 사용 가능..언제부터?	편의점에서 술이나 담배를 구입할 때 실물 신분증이 없어도 스마트폰으로 신분 확인이 ...	뉴스1에 따르면 지난 23일 편의점 업계 측은 CU GS25가 각각 SK텔레콤 KT...	[(모바일, 2), (운전면허증, 2), (서비스, 2)]	[(편의점에서, 1), (술이나, 1), (담배를, 1)]	[(따르면, 1), (23일, 1), (편의점, 1), (GS25가, 1), (SK...	44%	12	34.58%
31	생활_문화	네이버웹툰 원작 애니메이션 '신의 탑' 24일 최종회	국내외에서 많은 화제 속에 선보인 네이버웹툰 원작 애니메이션 '신의 탑'이 24일 ...	네이버웹툰은 지난 4월 1일 한 미 일 등에서 동시에 첫방영 이후 꾸준히 화제를 모...	[(애니메이션, 3), (네이버웹툰은, 2), (기반으로, 2)]	[(애니메이션, 2), ('신의, 2), (24일, 2)]	[(애니메이션, 2), (등에서, 1), (동시에, 1), (첫방영, 1), (꾸준...	28%	12	34.58%
32	생활_문화	코멕스산업, 신개념 아이스 쿨러백 신제품 3종 출시	코멕스산업이 미니배낭, 폴더블형 등 다양한 타입으로 활용성을 강화한 보냉백 신제품 ...	아이스 미니배낭 쿨러백 의 앞 부분에는 실제 배낭처럼 다용도 포켓을 추가해 카드지갑...	[(폴더블, 4), (아이스, 3), (쿨러백, 3)]	[('아이스, 4), (미니배낭, 3), (쿨러백, 3)]	[(쿨러백, 3), (폴더블, 2), (미니배낭, 1), (쇼퍼백, 1)]	8%	4	34.58%
33	생활_문화	기아차, 6년 만에 확 바뀐 `4세대 카니발` 디자인 공개	기아자동차가 프리미엄 감성으로 재탄생한 4세대 카니발의 외장 디자인을 24일 공개했...	신형 카니발의 외관은 역동적이고 미래지향적인 이미지를 강조한 전면부 독창적인 디자인...	[(강조한, 2), (디자인, 2), (기아차, 2)]	[(카니발의, 2), (기아자동차가, 1), (프리미엄, 1)]	[(카니발의, 1), (모습으로, 1), (4세대, 1), (연결돼, 1), (후면...	33%	14	34.58%
34	생활_문화	오늘 전국 장마 시작…내일 낮까지 비, 곳곳 천둥·번개·돌풍	수요일인 24일에 본격적인 장마가 시작되겠다. 기상청은 이날 "새벽에 서해안부터 비...	기상청은 이날 새벽에 서해안부터 비가 시작돼 낮에는 전국으로 확대되겠다 며 내일 2...	[(기상청은, 1), (새벽에, 1), (서해안부터, 1)]	[(12시부터, 2), (있겠다, 2), (수요일인, 1)]	[(새벽에, 1), (서해안부터, 1), (시작돼, 1), (낮에는, 1), (전국...	27%	11	34.58%
35	생활_문화	할리스커피 폴딩카트 대란…실시간 재고 현황은?	할리스커피 '멀티 폴딩카드'가 한 포털 실시간 검색어에 등장해 화제다. 할리스커피가...	스포츠경향 할리스커피 폴딩카트 대란 실시간 재고 현황은 할리스커피 제공할리스커피 멀...	[(할리스커피, 2), (실시간, 2), (폴딩카드, 2)]	[('멀티, 2), (폴딩카드, 2), (할리스커피, 1)]	[(폴딩카드, 2), (할리스커피, 1), (실시간, 1), (검색어에, 1), (...	52%	16	34.58%
36	생활_문화	‘호텔 델루나’ 미국서 리메이크...美스카이댄스와 첫 프로젝트	드라마 '호텔 델루나'가 미국에서 TV 시리즈로 제작된다. 스튜디오드래곤과 美 제작...	스튜디오드래곤 X 스카이댄스 호텔 델루나 TV시리즈 공동 기획 제작 계약 체결...	[(델루나, 3), (스카이댄스, 2), (TV시리즈, 2)]	[(드라마, 2), (제작사, 2), ('호텔, 1)]	[(델루나, 1), (스카이댄스가, 1), (스카이댄스와, 1), (ENM과, 1)...	36%	14	34.58%
37	생활_문화	신형 카니발 디자인 공개…대형 SUV 못지않은 웅장함	기아자동차가 4세대 카니발의 외장 디자인을 24일 공개했다. 리어콤비램프를 연결하는...	신형 카니발 외장 디자인 기아차 제공 뉴스1 서울 뉴스1 임해중 기자 기아자동차가 ...	[(카니발, 2), (디자인, 2), (기아차, 2)]	[(카니발의, 2), (기아자동차가, 1), (4세대, 1)]	[(카니발의, 2), (기아자동차가, 1), (4세대, 1), (디자인을, 1), ...	16%	5	34.58%
38	생활_문화	아이유 '호텔 델루나', 미국서 리메이크 착수	지난해 인기리에 방영된 tvN '호텔 델루나'가 미국에서 TV시리즈로 리메이크되는 ...	호텔 델루나 제작사 스튜디오드래곤은 24일 미국 할리우드 제작사 스카이댄스와 미국 ...	[(델루나, 2), (제작사, 2), (밝혔다, 2)]	[('호텔, 3), (델루나, 3), (제작사, 2)]	[(델루나, 2), (제작사, 2), (스튜디오드래곤은, 1), (24일, 1), ...	32%	12	34.58%
39	생활_문화	한국전기연구원, 'GOOSE' 국제공인 시험 자격 획득	한국전기연구원은 스마트그리드 통신 분야 세계 유일의 시험인증기구인 UCAIug로부터...	사진 뉴시스 자료사진 창원 뉴시스 홍정명 기자 한국전기연구원 KERI 원장 최규하 ...	[(GOOSE, 4), (IEC, 3), (61850, 3)]	[(61850, 3), (국제공인, 3), (자격을, 3)]	[(61850, 3), (GOOSE, 2), (국제공인, 2), (자격을, 2), ...	30%	20	34.58%
40	세계	美 대표 IT 기업들, H-1B 비자 발급 중단에 집단 반발	도널드 트럼프 미국 대통령이 외국인근로자 취업비자 발급을 중단하는 행정명령에 서명하...	순다 피차이 구글 최고경영자 CEO AFP 뉴스1 서울 뉴스1 박혜연 기자 도널드 ...	[(피차이, 2), (최고경영자, 2), (CEO, 2)]	[(도널드, 1), (트럼프, 1), (대통령이, 1)]	[(도널드, 1), (트럼프, 1), (대통령이, 1), (외국인근로자, 1), (...	42%	15	34.58%
41	세계	트럼프 지지율 43%…2년 6개월來 최저치	도널드 트럼프 대통령에 대한 지지율이 2년 6개월만에 최저치로 떨어졌다. 23일 더...	사진 연합뉴스 도널드 트럼프 대통령에 대한 지지율이 2년 6개월만에 최저치로 떨어졌...	[(트럼프, 3), (연합뉴스, 1), (도널드, 1)]	[(트럼프, 2), (도널드, 1), (대통령에, 1)]	[(트럼프, 2), (도널드, 1), (대통령에, 1), (지지율이, 1), (6개...	47%	14	34.58%
42	세계	"인구의 최소 43% 항체 가져야 집단면역 달성"英·스웨덴 연구	신종 코로나바이러스 감염증이 더이상 확산되지 않는 집단면역이 형성되기 위해서는 최소...	서울 뉴시스 유세진 기자 신종 코로나바이러스 감염증 코로나19 이 더이상 확산되지 ...	[(코로나19, 2), (사람들이, 2), (뉴시스, 1)]	[(집단면역이, 3), (사람들이, 3), (가져야, 2)]	[(사람들이, 2), (코로나바이러스, 1), (코로나19, 1), (더이상, 1)...	50%	20	34.58%
43	세계	재선 급한 트럼프, 또 국민에 현금지급 만지작	도널드 트럼프 미국 대통령이 국민에게 또 한 번 현금을 직접 나눠주는 안을 지지하는...	AP 헤럴드경제 홍성원 기자 도널드 트럼프 미국 대통령이 국민에게 또 한 번 현금을...	[(트럼프, 2), (대통령이, 2), (헤럴드경제, 1)]	[(트럼프, 2), (대통령이, 2), (도널드, 1)]	[(트럼프, 2), (대통령이, 2), (도널드, 1), (국민에게, 1), (현금...	67%	20	34.58%
44	세계	브라질, 5천만 명 코로나19 검사 추진...첫 대규모 집단검사	브라질에서 코로나19 감염자가 115만 명을 넘어선 가운데 전체 인구의 4분의 1을...	에두아르두 파주엘루 보건부 장관 대행은 현지 시간 23일 의회에 출석해 전체 국민의...	[(파주엘루, 2), (보건부, 2), (대행은, 2)]	[(코로나19, 2), (브라질에서, 1), (감염자가, 1)]	[(코로나19, 2), (파주엘루, 1), (보건부, 1), (대행은, 1), (2...	47%	16	34.58%
45	세계	日 롯데, 신동빈 회장 '이사 해임안' 논의…"부결 가능성 높아"	일본 롯데홀딩스가 24일 정기주주총회를 열고 신동빈 롯데그룹 회장의 '이사 해임 안...	재계와 SDJ코퍼레이션에 따르면 일본 롯데홀딩스는 이날 오전 9시30분 일본 도쿄에...	[(신동빈, 3), (롯데그룹, 2), (회장의, 2)]	[(신동빈, 3), (정기주주총회를, 2), (롯데그룹, 2)]	[(신동빈, 3), (롯데그룹, 2), (회장의, 2), (SDJ코퍼레이션에, 1)...	32%	12	34.58%
46	세계	美인도태평양사령부, 항모 2척 훈련 연일공개…"항모 공격전단 힘 엄청나"	북한의 도발이 계속되고 있는 가운데 미군이 한반도 주변 해역에서 진행되고 있는 핵추...	필리핀해에서 지난 주말 훈련 시작해 23일 끝나 항모 1척의 공격전단 힘 엄청난데 ...	[(필리핀해에서, 2), (CVN, 2), (시작해, 1)]	[(USS시어도어루스벨트함과, 2), (USS니미츠함, 2), (공격전단이, 2)]	[(필리핀해에서, 1), (공격전단, 1), (2척의, 1), (24일, 1), (...	53%	18	34.58%
47	세계	트럼프 "코로나 검사 속도 늦추라는 말, 농담 아니다"	신종 코로나바이러스 감염증 검사 속도를 늦춰야 한다는 발언으로 논란을 일으켰던 도널...	트럼프 대통령은 이날 백악관에서 코로나19 검사를 늦추라고 지시한 것은 농담인가 라...	[(트럼프, 3), (검사를, 2), (늦추라고, 2)]	[(코로나바이러스, 1), (감염증, 1), (속도를, 1)]	[(트럼프, 1), (대통령은, 1), (백악관에서, 1), (검사를, 1), (늦...	28%	10	34.58%
48	세계	WSJ, “중국 정부 연계 후원자들, 조직적으로 트럼프에 접근” 폭로	중국 정부 연계 후원자들이 조직적으로 드널드 트럼프 미국 대통령과 공화당에 접근했다...	트럼프 공화당 후원 단체에 거액 기부하며 접근미 정부의 중국 관련 현안에 대해 로비...	[(트럼프, 4), (공화당, 2), (정치인사들에게, 2)]	[(후원자들이, 2), (조직적으로, 1), (드널드, 1)]	[(후원자들이, 2), (트럼프, 1), (대통령, 1), (조직적으로, 1), (...	32%	18	34.58%
49	세계	7100억원 가진 억만장자, 안타까운 인생 결말	미국의 영화 제작자이자 억만장자인 스티브 빙이 고층 아파트 발코니에서 추락해 향년 ...	미국의 영화 제작자이자 억만장자인 스티브 빙이 고층 아파트 발코니에서 추락해 향년 ...	[(스티브, 3), (미국의, 2), (제작자이자, 2)]	[(스티브, 2), (미국의, 1), (제작자이자, 1)]	[(스티브, 2), (미국의, 1), (제작자이자, 1), (억만장자인, 1), (...	27%	8	34.58%
50	IT_과학	영화 ‘아마겟돈’이 현실로…우주선 충돌시켜 소행성 궤도 바꾼다	미국 항공우주국이 내년 6월 작은 우주선을 발사해 우주에 있는 한 소행성과 물리적인...	충돌하는 소행성 이름은 디모포스 지디넷코리아 이정현 기자 미국 항공우주국 NASA ...	[(소행성, 4), (NASA, 3), (충돌을, 2)]	[(우주선을, 3), (궤도를, 2), (항공우주국이, 1)]	[(소행성, 1), (우주선을, 1), (발사해, 1), (우주에, 1), (소행성...	24%	10	34.58%
51	IT_과학	두리폰, 갤럭시S20·갤노트10 특가…최대 90% 할인 개통	온라인 최신 스마트폰 종합 할인몰 '두리폰'은 삼성전자의 최신 스마트폰 갤럭시S20...	사진 두리폰 이데일리 이재길 기자 온라인 최신 스마트폰 종합 할인몰 두리폰 은 삼성...	[(두리폰, 2), (스마트폰, 2), (갤럭시S20, 2)]	[(스마트폰, 2), (온라인, 1), (할인몰, 1)]	[(스마트폰, 2), (온라인, 1), (할인몰, 1), (삼성전자의, 1), (갤...	35%	12	34.58%
52	IT_과학	틴더 CEO "디지털 데이팅도 진짜 데이트"	스마트폰에 뜬 이성의 사진이 마음에 들면 손가락으로 화면을 오른쪽으로 밀면서 '좋다...	3억명 이상 사용 세계 최대 데이팅 앱 틴더 사이드먼 CEO 코로나가 디지털 장벽 ...	[(사이드먼, 2), (3억명, 1), (데이팅, 1)]	[(스마트폰에, 1), (이성의, 1), (사진이, 1)]	[(사이드먼, 1), (틴더의, 1), (스마트폰에, 1), (이성의, 1), (사...	48%	13	34.58%
53	IT_과학	베스핀글로벌, 전동킥보드 공유 ‘킥고잉’ 클라우드 사업 완료	베스핀글로이 올룰로의 클라우드 프로젝트를 완료했다고 24일 밝혔다. 올룰로는 자체적...	올룰로 AWS 인프라 개선 대용량 데이터 처리 인프라 구축도 추진베스핀글로 대표 이...	[(올룰로, 2), (인프라, 2), (클라우드, 2)]	[(AWS, 5), (프로젝트를, 2), (개선을, 2)]	[(AWS, 1), (인프라, 1), (클라우드, 1), (프로젝트를, 1), (완...	23%	8	34.58%
54	IT_과학	클럽·노래방 들어갈때 '패스'앱으로 QR코드 찍는다	오늘부터 클럽과 노래방 등 신종 코로나 바이러스 전파 우려가 높은 정부 지정 '고위...	오늘부터 클럽과 노래방 등 신종 코로나 바이러스 전파 우려가 높은 정부 지정 고위험...	[(본인인증, 2), (오늘부터, 1), (클럽과, 1)]	[(본인인증, 2), (오늘부터, 1), (클럽과, 1)]	[(본인인증, 2), (오늘부터, 1), (클럽과, 1), (노래방, 1), (코로...	71%	20	34.58%
55	IT_과학	구미시·구미산단, LG유플러스와 5G 특화도시로 '탈바꿈'	LG유플러스는 24일 구미시, 금오공과대학교와 함께 구미시에 5G 기술 기반 스마트...	재판매 및 DB 금지 서울 연합뉴스 조성흠 기자 LG유플러스는 24일 구미시 금오공...	[(인프라를, 3), (LG유플러스는, 2), (구미시에, 2)]	[(인프라를, 2), (LG유플러스는, 1), (24일, 1)]	[(인프라를, 2), (LG유플러스는, 1), (24일, 1), (구미시, 1), ...	38%	20	34.58%
56	IT_과학	LG유플러스, 탁상시계 형태 ‘클로바 클락+’ 출시	LG유플러스는 다음달 중 네이버와 함께 LED 탁상시계 형태의 AI스피커 '클로바 ...	AI리모컨 접목해 오래된 가전 통제 가능날씨 미세먼지 시각화 실생활 활용도 높아LG...	[(클로바, 3), (미세먼지, 2), (AI스피커, 2)]	[(탁상시계, 2), (LG유플러스는, 1), (다음달, 1)]	[(탁상시계, 2), (AI스피커, 1), (다음달, 1), (네이버와, 1), (...	48%	20	34.58%
57	IT_과학	LGU+, 구미 5G 특화도시 만든다…5G 전용망 구축	LG유플러스가 구미를 5G 특화도시로 만든다. LG유플러스는 구미시, 금오공과대학교...	구미시∙금오공대와 5G기술 기반의 스마트시티∙팩토리 인프라 구축을 위한 협력 아이...	[(5G기술, 2), (기반의, 2), (스마트시티∙팩토리, 2)]	[(LG유플러스가, 1), (구미를, 1), (특화도시로, 1)]	[(기반의, 1), (스마트시티∙팩토리, 1), (인프라, 1), (구축을, 1),...	34%	12	34.58%
58	IT_과학	'T맵주차' 원스톱 서비스…'인천·부산·수원' 도입	앞으로 인천국제공항∙부산시청∙수원시 공영주차장 등에서도 'T맵주차'기능을 사용할 수...	SK텔레콤 모델이 인천공항 주차장에서 T맵주차 를 이용하는 모습 출처 SKT T맵주...	[(T맵주차, 5), (주차장, 5), (이용할, 2)]	[(주차장, 3), (서비스, 2), (주차장을, 2)]	[(주차장, 3), (주차장을, 2), (SK텔레콤, 1), (T맵주차, 1), (...	24%	11	34.58%
59	IT_과학	LGU+, 구미시에 ‘5G 특화도시’ 조성… “드론이 순찰하고, 로봇이 물품운반”	LG유플러스는 구미시, 금오공과대학교와 손잡고, '5G 이동통신 기술 기반의 스마트...	구미산단 중심으로 5G 전용망 구축 공장 제조∙생산 과정에 ICT 기술 접목 스마트...	[(ICT, 2), (구미산단, 1), (중심으로, 1)]	[(LG유플러스는, 1), (구미시, 1), (금오공과대학교와, 1)]	[(구미시, 1), (금오공과대학교와, 1), (손잡고, 1), (이동통신, 1),...	28%	11	34.58%

python: 200629-gensim_bm25-Copy1, BM25Okapi (0)	2020.06.30
200625-yoyag_test_008-006.002, 젠심 요약본뉴스 (0)	2020.06.25
파이썬 정규표현식 관련, 범위지정 삭제, 수정 (0)	2020.06.24
200623-파이썬_004.009_headless_결측치제거(성공) (0)	2020.06.24
200623-yoyag_test_008-002, 요약테스트 (0)	2020.06.24

무회 Blog

무회 Blog

python: # python 200623-yoyag_test_008-005 본문

python: # python 200623-yoyag_test_008-005

'Python' 카테고리의 다른 글

티스토리툴바