regex - Break a line after multiple matched words - python -
i have line of words: dane osobowe po zmianie (dopisane): surname1 name1 (ryszard, eugenia) zam. 99-100 muczyn (geod) 6a, płeć: k, pesel: 99945104321 jednostki rejestrowe osoby (w gminie): 0001.g16 0002.g56 surname2 name2 (andrzej, agnieszka) zam. 99-100 muczyn (geod) 4a, płeć: k jednostki rejestrowe osoby (w gminie): 0001.g16 0001.g07 0001.g43 surname1 name1 name2 (andrzej, agnieszka) zam. 99-100 muczyn (geod) 4a, płeć: m jednostki rejestrowe osoby (w gminie): 0001.g16
i want break multiple lines in pattern:
dane osobowe po zmianie (dopisane): surname1 name1 (ryszard, eugenia) zam. 99-100 muczyn (geod) 6a, płeć: k, pesel: 99945104321
jednostki rejestrowe osoby (w gminie): 0001.g16 0002.g56
surname2 name2 (andrzej, agnieszka) zam. 99-100 muczyn (geod) 4a, płeć: k
jednostki rejestrowe osoby (w gminie): 0001.g16 0001.g07 0001.g43
surname1 name1 name2 (andrzej, agnieszka) zam. 99-100 muczyn (geod) 4a, płeć: m
jednostki rejestrowe osoby (w gminie): 0001.g16
i have code:
for in range(0, len(data)): data[i] = data[i].replace(' jednostki', '\njednostki')
in data have single line mentioned above. managed break that:
dane osobowe po zmianie (dopisane): surname1 name1 (ryszard, eugenia) zam. 99-100 muczyn (geod) 6a, płeć: k, pesel: 99945104321
jednostki rejestrowe osoby (w gminie): 0001.g16 0002.g56 surname2 name2 (andrzej, agnieszka) zam. 99-100 muczyn (geod) 4a, płeć: k
jednostki rejestrowe osoby (w gminie): 0001.g16 0001.g07 0001.g43 surname1 name1 name2 (andrzej, agnieszka) zam. 99-100 muczyn (geod) 4a, płeć: m
jednostki rejestrowe osoby (w gminie): 0001.g16
so, problem wan't break further after 0001.g16 0002.g56 or jednostki rejestrowe osoby (w gminie): 0001.g16 0001.g07 0001.g43
there's regex needed how deal number of 0001.g** changing.
cheers!
match [0-9]{4}.g[0-9]{2}(?: [0-9]{4}.g[0-9]{2})*
replace \0\n
https://regex101.com/r/5sfael/2
both operations single regexp:
match ([0-9]{4}.g[0-9]{2}(?: [0-9]{4}.g[0-9]{2})* |( )(?=jednostki))
https://regex101.com/r/5sfael/3
regex101 provides explanation of what's going on.
Comments
Post a Comment