User talk:Ark25/Romanian diacritics/Replacements in titles

Scripts
The script to transform S/T-cedilla into S/T-comma: cat in.txt ^ | sed -e "s/\xc5\x9f/\xc8\x99/g" ^ | sed -e "s/\xc5\x9e/\xc8\x98/g" ^ | sed -e "s/\xc5\xa3/\xc8\x9b/g" ^ | sed -e "s/\xc5\xa2/\xc8\x9a/g" > out.txt paste in.txt out.txt | sed -e "s/\(.*\)\t\(.*\)/#\1 --- \2/" > out2.txt

The script to remove the titles containing Turkish, non-Romanian characters: ç, ğ, ı, ö, ü cat in.txt ^ | sed -e "s/.*\xc3\xa7.*//g" ^ | sed -e "s/.*\xc3\x87.*//g" ^ | sed -e "s/.*\xc4\x9f.*//g" ^ | sed -e "s/.*\xc4\x9e.*//g" ^ | sed -e "s/.*\xc4\xb1.*//g" ^ | sed -e "s/.*\xc4\xb0.*//g" ^ | sed -e "s/.*\xc3\xb6.*//g" ^ | sed -e "s/.*\xc3\x96.*//g" ^ | sed -e "s/.*\xc3\xbc.*//g" ^ | sed -e "s/.*\xc3\x9c.*//g" > out.txt

Examples
Articles correctly containing both S-cedilla and S-comma: Mareşal

Articles correctly containing both Romanian comma-diacritics and Turkish-only diacritics: Starčevo–Kőrös–Criș culture

Resources: User:Strainu/ro - Bot_requests/Archive_36 and also a sandbox

wrong renames (made by me): Battle of Ulaş, Nejla Ateş, Torku Şeker Spor

unnecessary redirects: • # Alașa

• # Alașar

• # Ardeșen

• # Ardușlu

• # Ateș

• # Avaș

• # Battle of Ulaș

• # Dașca

• # Dolmuș

• # Durmuș

• # Durmușlu

• # Durulmuș

• # Fatma Neslișah

• # Geniș Aile

• # Gevaș

• # Hamoșam

• # Havuș

• # Haydar Baș

• # Hemșin

• # Heșan

• # Kovșad

• # Lefkoșa District

• # Mașioba

• # Mașxan

• # Memiș Agha

• # Mirușen

• # Necati Ateș

• # Nejla Ateș

• # Orhan Șam

• # Păpușa Peak (Parâng Mountains)

• # Perșembe

• # Peșrev

• # Rașit Meredow

• # Remeșin

• # Reșo Zîlan

• # Rușan

• # Șahan Gökbakar

• # Saldaș

• # Șambul

• # Șaphane

• # Șaplar

• # Șarifan

• # Savaștepe

• # Șenpazar

• # Șile

• # Șilim

• # Șimal

• # Șin

• # Șiran

• # Șirinsu

• # Șirvan

• # Șovu

• # Șovut

• # Șuhut

• # Șule

• # Șurtan

• # Șurud

• # Șuvaș

• # Șuvi, Astara

• # Telișli

• # Temeșvar Eyalet

• # Teșkan

• # Tonașen

• # Torku Șeker Spor

• # Vașa

• # Viranșehir