Makine çevirisi, Google Translate yüzünden ciddi bir itibar kaybı yaşadı. Oysa, doğru yöntemlerle kullanıldığında işletmeler için ciddi hız ve bütçe avantajları kazandırabiliyor. İngilizce – Türkçe iyi makine çevirisi yapılmaya başlandı bile. İşte size, iyi makine çevirisi için beş altın kural.

1. Makine de insan gibidir, sadece bildiği konuları iyi çevirebilir:

Google’ın düşü, her şeyi çeviren bir motor kurmak. Çeviri performansı yüz üzerinden en fazla 30. Somut örnekler, konuya ve projeye özgü bir motorun %60 – 80 verimle çalışabildiğini gösteriyor. Yani bir markanın elektrikli ürünleri düşünülerek ayarları yapılmış çeviri motoru, çevirinin %60’ını yapıyor. Üzerini ciddi bir editör kontrolüyle tamamlıyorsunuz. Elektrikli aksamı çeviren motora, mekanik bölümleri verdiğinizde performans %30’lar seviyesine düşüveriyor. İnsanlar bildikleri konularda iyi çeviri yapar; makineler de öyle.

2. Terim listelerinizi normalleştirmeniz gerekiyor:

Normalleştirmekten kast ettiğimiz, eklerden ve farklı yazımlardan arındırmaktır. Örneğin İngilizce terimleri yazarken fiillerin tek hali kullanılmalı “-ing, -ed” ekli halleri girilmemelidir. Sonu “ize” ile biten sözcükler (organize gibi), daima tek tip yazılmalı; hem “-ize” hem “-ise” aynı listede kullanılmamalıdır. Aksi taktirde motorun istatistiksel mantığı zarar görür.

3. Makineyi arkaalan bilgisiyle beslemelisiniz:

Tıpkı iyi bir çevirmenin, çevirdiği konuyla ilgili araştırması, okumalar yapması, arkaalan bilgisini geliştirmesi gibi, iyi bir makine motorunun da tek dilli (monolingual) verilerle beslenmesi gerekir. Yukarıdaki örnekte, elektrikli ürünlerin makine çevirisini iyi yapmak istiyorsanız, ilgili ne kadar çok belge, site, kaynak varsa, okuması için motora yükleyin ki kendini geliştirsin, çeviriyi doğru yorumlasın.

4. İyi makine çevirisinde hafif düzeltme ve tam düzeltmeden oluşan en az iki adım vardır:

Makine size %60 – 80 çevrilmiş metinler verecek. Bazı cümlecikleri, şaşırtıcı derecede iyi çevirirken, bazılarında cümlenin başı sonu kayacaktır. Bu çeviriyi bildiğimiz, güvenilir, kaliteli bir seviyeye getirmek ikinci adımdaki editörün görevidir. O adıma tam düzeltme (full post edit) diyoruz. Birinci adımda, terim eksikse tamamlıyoruz, sözdizimini düzeltiyoruz (fiil ortada, özne sonda gelebiliyor), fiil yoksa vermek, olmak, yapmak gibi basit bir fiil koyup cümleyi tamamlıyoruz. Bir tür bulmaca, kelime oyunu gibi. Bunun amacı, makinenin istatistiksel mantığını bozmamak. Örneğin, makine cümleye “eğer” ile başlamışsa, birinci adımda, “bu cümleyi eğersiz de yazarım” demiyoruz. Akıcılık ve uslup kontrolünü ikinci aşamaya bırakıyoruz. Kısaca anlattığım bu kalite yönetimine MLF adını veriyoruz (Machine + Light post-edit + Full post-edit). Tahmin edeceğiniz üzere, birinci aşamadaki düzeltmeler, makineyi eğitmek için kullanılıyor.

5. Makine motoru öğrenmeye devam etmelidir:

Makine motoru neleri çeviremiyorsa, hangi cümle türlerinde çuvallıyorsa, o tarz metinler ve örnek çeviriler makineye beslenmelidir. Aynen insanı eğitir gibi, “bak dostum hataların bunlar, doğrusu da bunlar” diyerek sürekli gelişim planlanmalıdır. Eğer programcı dostlarınız varsa, bazı dilbilgisi kurallarını veya müşteri tercihlerini tanımayı ya da kaynak metindeki yazım hatalarını otomatik düzeltmeyi  sağlayan kurallar ekleyebilirsiniz. Sonuçta karşımızdaki bir makine, anladığı dil “java, pearl, regex” gibi diller.

Medikal firmalar, otomotiv şirketleri, elektrik ve elektronik cihazlar için makine çevirisinden verim almak mümkün. Biz bazı projelerimizde kullanıyoruz ve çok memnunuz.

Peki %60 verimle çalışacak bir makine motoru ne kadar sürede hazır olur? İşi bilen bir ekip için, eğer elde bolca veri varsa en az üç ay zaman alır. Kısıtlı veri ve yeni öğrenen bir ekip bir yılı gözden çıkarmalıdır. Her proje için, her konu için, her metin türü için makine çevirisi yaptırırım sevdasına kapılmayın. Hırs yapmak boşuna. Seçici ve odaklı çalışırsanız modern teknolojiden daha çok yararlanırsınız.