# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility
import re
regex = r"\b(?:UG \(haftungsbeschränkt\)|(?:gG|g|Gesellschaft )?mbH|GbR|OHG|[KUeA]G|(?:g|Inv)AG|KGaA|e..?v..?|Limited|Stiftung|PartG(?: mbB)?|Partenreederei|Eigenbetrieb|Einzelunternehmen|Regiebetrieb|VVaG|SC?E|[AK]öR|Reit-AG)\s*(?:\&\s*Co.\s*(?:KGa?A?|OHG))?\b"
test_str = ("Unternehmen Regex GbR\n"
"Unternehmen Regex KG\n"
"Unternehmen Regex AG & Co. KG\n"
"Unternehmen Regex GmbH & Co. KG\n"
"Unternehmen Regex Limited & Co. KG\n"
"Unternehmen Regex Stiftung & Co. KG\n"
"Unternehmen Regex Stiftung GmbH & Co. KG\n"
"Unternehmen Regex UG (haftungsbeschränkt) & Co. KG\n"
"Unternehmen Regex OHG\n"
"Unternehmen Regex GmbH & Co. OHG\n"
"Unternehmen Regex AG & Co. OHG\n"
"Unternehmen Regex Partenreederei\n"
"Unternehmen Regex PartG\n"
"Unternehmen Regex PartG mbB\n"
"Unternehmen Regex AG\n"
"Unternehmen Regex gAG\n"
"Unternehmen Regex GmbH\n"
"Unternehmen Regex gGmbH\n"
"Unternehmen Regex InvAG\n"
"Unternehmen Regex KGaA\n"
"Unternehmen Regex AG & Co. KGaA\n"
"Unternehmen Regex SE & Co. KGaA\n"
"Unternehmen Regex GmbH & Co. KGaA\n"
"Unternehmen Regex Stiftung & Co. KGaA\n"
"Unternehmen Regex REIT-AG\n"
"Unternehmen Regex UG (haftungsbeschränkt)\n"
"Unternehmen Regex AöR\n"
"Unternehmen Regex eG\n"
"Unternehmen Regex Eigenbetrieb\n"
"Unternehmen Regex Einzelunternehmen\n"
"Unternehmen Regex e. V.\n"
"Unternehmen Regex KöR\n"
"Unternehmen Regex Regiebetrieb\n"
"Unternehmen Regex Stiftung\n"
"Unternehmen Regex VVaG\n"
"Unternehmen Regex EWIV\n"
"Unternehmen Regex SE\n"
"Unternehmen Regex SCE\n"
"Unternehmen Regex Gesellschaft mbH")
matches = re.finditer(regex, test_str, re.MULTILINE | re.UNICODE | re.DOTALL | re.IGNORECASE)
for matchNum, match in enumerate(matches, start=1):
print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))
for groupNum in range(0, len(match.groups())):
groupNum = groupNum + 1
print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))
# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.
Please keep in mind that these code samples are automatically generated and are not guaranteed to work. If you find any syntax errors, feel free to submit a bug report. For a full regex reference for Python, please visit: https://docs.python.org/3/library/re.html