# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility
import re
regex = r"\b\w+\b"
test_str = (" Art. 3.\n"
"1. Grupa producentów rolnych, zwana dalej \"grupą\", prowadzi działalność jako\n"
" przedsiębiorca mający osobowość prawną pod warunkiem, że:\n"
" 1) została utworzona przez producentów jednego produktu rolnego, zwanego\n"
" dalej \"produktem\", lub grupy produktów w celach określonych w\n"
" art. 2,\n"
" 2) działa na podstawie statutu lub umowy, zwanych dalej \"aktem\n"
" założyielskim\", spełniających wymagania określone w art. 4,\n"
" 3) składa się z członków, udziałowców lub akcjonariuszy, zwanych dalej\n"
" \"członkami grupy\", z których żaden nie może mieć więcej niż 20% głosów na\n"
" walnym zgromadzeniu lub zgromadzeniu wspólników,\n"
" 4) osiąga co najmniej:\n"
" - w pierwszym roku działalności - 51%,\n"
" - w drugim roku działalności - 60%,\n"
" - w trzecim roku i następnych latach działalności - 75%,\n"
" udokumentowanych przychodów ze sprzedaży produktów grupy wytworzonych w\n"
" gospodarstwach jej członków,\n"
" 5) określi obowiązujące członków grupy zasady produkcji, w tym dotyczące\n"
" jakości i ilości produktów lub grup produktów oraz sposoby przygotowania\n"
" produktów do sprzedaży.\n"
"2. Warunek, o którym mowa w pkt 4, obowiązuje po pierwszym roku działalności\n"
" grupy.\n")
matches = re.finditer(regex, test_str, re.MULTILINE)
for matchNum, match in enumerate(matches, start=1):
print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))
for groupNum in range(0, len(match.groups())):
groupNum = groupNum + 1
print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))
# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.
Please keep in mind that these code samples are automatically generated and are not guaranteed to work. If you find any syntax errors, feel free to submit a bug report. For a full regex reference for Python, please visit: https://docs.python.org/3/library/re.html