ect (or 2du) 8 лет назад
Родитель
Сommit
76ebe172e6
1 измененных файлов с 30 добавлено и 0 удалено
  1. 30 0
      set_mark/start.py

+ 30 - 0
set_mark/start.py

@@ -163,6 +163,36 @@ def start(conn, data, title):
     # 개행 정리
     # 개행 정리
     data = re.sub('\r\n', '\n', data)
     data = re.sub('\r\n', '\n', data)
 
 
+    # HTML 허용
+    src_list = ["www.youtube.com", "serviceapi.nmv.naver.com", "tv.kakao.com", "www.google.com", "serviceapi.rmcnmv.naver.com"]
+    html_list = ['div', 'span', 'embed', 'iframe', 'ruby', 'rp', 'rt']
+
+    html_data = re.findall('<(\/)?((?:(?!>| ).)+)( (?:(?:(?!>).)+)?)?>', data)
+    for in_data in html_data:
+        if in_data[0] == '':
+            if in_data[1] in html_list:
+                if re.search('<\/' + in_data[1] + '>', data):
+                    src = re.search('src=([^ ]*)', in_data[2])
+                    if src:
+                        v_src = re.search('http(?:s)?:\/\/([^/\'" ]*)', src.groups()[0])
+                        if v_src:
+                            if not v_src.groups()[0] in src_list:
+                                and_data = re.sub(''', '\'', re.sub('"', '"', re.sub('src=([^ ]*)', '', in_data[2])))
+                            else:
+                                and_data = re.sub(''', '\'', re.sub('"', '"', in_data[2]))
+                        else:
+                            and_data = re.sub(''', '\'', re.sub('"', '"', re.sub('src=([^ ]*)', '', in_data[2])))
+                    else:
+                        and_data = re.sub(''', '\'', re.sub('"', '"', in_data[2]))
+
+                    print(and_data)
+
+                    data = re.sub('&lt;' + in_data[1] + in_data[2] + '&gt;', '<' + in_data[1] + and_data + '>', data, 1)
+                    data = re.sub('&lt;\/' + in_data[1] + '&gt;', '</' + in_data[1] + '>', data, 1)
+
+    position = re.compile('position', re.I)
+    data = position.sub('', data)
+
     # 표 정리
     # 표 정리
     data = re.sub('\n( +)\|\|', '\n||', data)
     data = re.sub('\n( +)\|\|', '\n||', data)
     data = re.sub('\|\|( +)\n', '||\n', data)
     data = re.sub('\|\|( +)\n', '||\n', data)