regular expressions nedir ve kullanımı

Regular expression bir metni düzenlemek yada metin içerisinden belli kurallara uyan alt metinler elde etmek için kullandığımız bir dildir. Bir regular expression, string tipindeki karakter topluluğuna uygulanır. Sonuç olarak substringler oluşur yada orjinal metnin bir kısmını içeren değiştirilmiş yeni metinler elde edilir.

Regular Expression’larda Kullanılan Özel Karakterler ve Etkileri

Regular expression desenleri tanımlamada kullanılan özel karakterleri örnekleri ile anlatırsak sanırım regular expressionlar daha tanıdı ve kolay gelebilir.

Regular Expression’larda kullanılan özel karakterler

1. \d Herhangi bir rakamı ifade eder.

2. .(nokta) Satır başı hariç herhangi bir karakteri ifade eder.

3. \w Herhangi bir harfi, rakamı veya alt tireyi ifade eder.

4. \s Herhangi bir görünmez karakteri ve boşluğu ifade eder. (Boşluk, tab, satır başı gibi)

5. ^ Başlangıcı ifade eder.

6. $ Sonu ifade eder.

7. * Kendinden önce yazılmış karakterin; sıfır veya daha fazla tekrar etmesini ifade eder.

8. + Kendinden önce yazılmış karakterin; bir veya daha fazla tekrar etmesini ifade eder.

9. ? Kendinden önce yazılmış karakterin; olsa da olur olmasa da olurunu ifade eder.

10. {123} Kendinden önce yazılmış karakterin; parantez içerisine yazılan sayı kadar tekrar etmesini ifade eder.

11. {1, 2} Kendinden önce yazılmış karakterin; parantez içerisinde yazılan iki sayı arasında tekrar etmesini ifade eder.

12. ( … ) Parantez içerisine yazılan ifadeleri gruplamaya yarar.

13. ( … | … ) Parantez içerisine yazılan “|” dik tire işareti ya da anlamına gelir, içerisine yazılan ve dik tire ile ayrılan ifadelerden herhangi birisinin eşleşmesini ifade eder.

14. … ] Köşeli parantez içerisine yazılan karakterlerden bir tanesini ifade eder.

15. \ Kaçış karakteri. Yukarıda yazdığımız karakterleri normal olarak yazmak istediğimizde başına kaçış işaretini koyarız.

16. \D Rakam olmayan herhangi bir karakteri ifade eder.

17. \S Görünmez ve boşluk olmayan karakteri ifade eder.

18. \W Harf, rakam veya alt tire olmayan karakteri ifade eder.

19. \b Kelimenin başını veya sonunu ifade eder.

20. [^ … ] Üç nokta yerine yazılan karakterler haricindeki karakterleri ifade eder.

21. [a-z] A dan z’ye olan harflerden birisini ifade eder.

Regular Expression örnekleri

1. </?[^>]+>: HTML etiketlerini ifade eder.

2. (((+|-)?\d+(\.\d*)?)|((+|-)?(\d*\.)?\d+)): Negatif veya pozitif tam ve ondalıklı sayı.

3. (\d{4})[.-/](\d{1,2})[.-/](\d{1,2}): yyyy.aa.gg biçimindeki tarih bilgisi.

4. SELECT ‘BT sorguda regexp BT’ REGEXP ‘[[:<:]]BT.*BT[[:>:]]’: MySQL’e özgü yazımla Regular Expression kullanımı.