Python में regular expression ये string पर operation करता है |

String पर match या किसी string को find/search करने के लिए regular expression काफी मददगार साबित होता है |
Python में अगर regular expression का इस्तेमाल करना हो तो 're' इस module का इस्तेमाल करना पड़ता है |
किसी भी regular expression के हिस्से का इस्तेमाल करना हो तो program पर 're' इस module को import करना पड़ता है |
जैसे कि.
import re
Raw String Notation for Regular Expression Patterns
Python में जब regular expression लिखना होता है तब Normal string के बजाय raw string का इस्तेमाल किया जाता है |
Raw String की शुरुआत 'r' इस prefix से की जाती है | अगर string पर 'r'(raw string) prefix दिया जाता है तो backslashes(\\) को किसी भी प्रकार से handle नहीं किया जा सकता है |
Difference Between Normal String and Raw String
Normal String
Normal String में '\n'(escape sequence) ये एक ही character होता है |
print(len("\n"))
#return 1
print("Hello World\nHello World")
#return
#Hello World
#Hello World
Raw String
Raw String में '\' और 'n' ये दोनों अलग-अलग characters होते है |
print(len(r"\n"))
#return 2
print("Hello World\nHello World")
#return Hello World\nHello World
In Regular Expression
Regular Expression में raw string का इस्तेमाल pattern के रूप में काफी बार किया जाता है |
"\\d+\\w" #Normal String
r"\d+\w" #Raw String
Matching a String
Syntax for match() Regular Expression Function
re.match(pattern, raw/string, flags)
Parameters
pattern : यहाँ पर pattern दिया जाता है |
raw/string : यहाँ पर pattern से match करने के लिए string या raw string दी जाती है |
flags : Optional. यहाँ पर एक या एक से ज्यादा flags दिए जाते है | Bitwise OR(|) से एक से ज्यादा flags का इस्तेमाल किया जाता है |
Example for match() Function in Python
Example में regular expression के match() function का इस्तेमाल किया गया है |
pattern : r"(\w+)\ (\d+)\ (\w+)
ये raw string दी गयी है | पहले group में characters(\w+) को match किया गया है बाद में एक space(\ ) दिया गया है उसके बाद digits(\d+) को match किया गया है उसके बाद फिर एक space(\ ) और आखिर में फिर characters को match किया गया है |
str : Hello 123 Hello
इस normal string पर operation किया गया है |
Source Code :import re
str = "Hello 123 Hello"
a = re.match(r"(\w+)\ (\d+)\ (\w+)", str)
print("group() :",a.group()) #return entire matches ((\w+)\ (\d+)\ (\w+))
print("group(0) :",a.group(0)) #return entire matches ((\w+)\ (\d+)\ (\w+))
print("group(1) :",a.group(1)) #return first subgroup match (\w+)
print("group(2) :",a.group(2)) #return seconnd subgroup match (\d+)
print("group(3) :",a.group(3)) #return third subgroup match (\w+)
Output :group() : Hello 123 Hello
group(0) : Hello 123 Hello
group(1) : Hello
group(2) : 123
group(3) : Hello
Python में Regular Expression में String पर operation करने के लिए कुछ हिस्से बनाये गए है |
- Character Classes
- Quantifiers
- Metacharacter
- Modifiers/Flags
- Regular Expression Functions
- Regular Expression Object Methods
- Regular Expression Match Object Methods