Почитал регулярки - ничего не понял Один чел как-то помог, но не до конца. Тут есть те, кто за регулярки шарит? <file dir="Data" filename="LOL">TEXT<file> нужно достать данные Data, LOL и TEXT с первыми двумя работает след регулярка - "<file dir=\"(.*?)\" filename=\"(.*?)\">" - на выходе [('Data', 'LOL')] Но как доработать, чтоб и TEXT брал? p.s. на петоне со стандартным импортом re
ага, у меня тоже кста Я короче, сделал так <file> TEXT <file> регулярку взял как "<file>(.*?)<file>" все равно не работает именно на петоне. Мб у него другая система? Хотя хз TEXT кста имеет оч большую длину еслчо. Не из-за этого ли?
Попробовал на питоне: Код (Text): import re text = "<file dir=\"Data\" filename=\"LOL\">TEXT<file>" parser = re.findall('<file dir=\"(.*?)\" filename=\"(.*?)\">(.*?)<file>', text) print(parser) Выводит: Код (Text): [('Data', 'LOL', 'TEXT')] https://i.imgur.com/2VreRug.png https://www.programiz.com/python-programming/online-compiler/
Да, но у меня Base64 где TEXT мб из-за этого? Не думаю А какая версия питона? --- Сообщение объединено, 9 дек 2020 --- понял проблему. Проблема в переносе: <file dir="Data" filename="LOL">TEXTaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa <file> вот так не работает а так - работает: <file dir="Data" filename="LOL">TEXTaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa<file> Можно ли как-то решить эту проблему? Прост в файле в основном перенос тега P.s. с большими данными тож не хочет работать
Кто-нибудь может мне объяснить в каком сумасшедшем мире питоном xml парсят с помощью регулярных выражений? https://docs.python.org/3/library/xml.etree.elementtree.html
Python 3.8.2 Код (Text): import re text = '''<file dir=\"Data\" filename=\"LOL\">TEXT <file>''' parser = re.findall('<file dir=\"(.*?)\" filename=\"(.*?)\">(.*?)\s?<file>', text) print(parser)
во, это решение братан. Благодарю Рел ;D у меня структура чуть другая прост, хотя хз, не пробовал. Прост сам мало играюсь с питоном... --- Сообщение объединено, 10 дек 2020 --- p.s. Рел, я крч совместил и все воркает - re.MULTILINE|re.DOTALL