internet ve dil

Mayıs 30, 2009 at 4:10 pm | In doğal dil işleme, yapay zeka, zihin | Leave a Comment
Tags: , , , , ,

insanlık yazıyla tanıştığından beri yazma eylemi hiç bu kadar yaygın olmamıştır. sokağa çıkınca her köşe başında bir yazara rastlamamız büyük olasılık. site ziyaretçi defterleri, yorumlar, bloglar, “sözlükler” derken, internet milyonlarca insanın düşüncelerini, başından geçenleri, hikayelerini vs. sergilediği devasa bir külliyata dönüştü. ses, resim ve film gibi çoklu ortam uygulamaları internette ne kadar ağırlığını artırsa da yazıdan vazgeçmek mümkün değil. hal böyle olunca hesaplamalı dil bilimcilerin ilgisi zamanla internet kaynaklı metinlere yöneliyor. hesaplamalı dil bilimi, dillerin sayısal ortamda temsil edilmesi, modellenmesi ve incelenmesini amaçlayan, bilgisayar bilimleri, istatistik, matematik ve dil bilimi alanlarını bir araya getiren disiplinler arası bir araştırma sahası. bu sahanın bir çoğu yapay zeka ile kesişen cüretkar hedefleri var: ses ve konuşma tanıma, imla denetimi, makine çevirisi, bilgi geri getirimi, soru cevaplama vb.

kitaplar ünlü yazar ve şairlerin kelimeleriyle doludur. cümle yapıları onların okuyucuyu “tavlamak” isteyen ya da yalnızca sanat yapmak için kullandıkları üslubun etkisiyle şekillenmiştir. yani çoğunlukla filtrelenmiş, düzeyli, seçkinci ve rafine bir dilden söz ediyorum. oysa halk genellikle başka bir dilde konuşur. bir eleştiri günlük hayatta sıradan insanların çok az kelime kullandığı yönündedir. fakat günlük hayatın gereği budur ve böyle olmak zorundadır. kim daha kısa bir yol varken uzununu tercih eder ki? az kelime kullanmak veya bazı bilinçli gramer ihlalleri yapmak çoğu kez bizim dille iletişim kurarken daha az çaba sarf etmemizi sağlar. hatta dilin evriminde önemli bir yere sahip olan “en az çaba ilkesi” de bunu destekler. o halde marifet sıradan bir günün sıradan bir telefon konuşmasında daha çok kelime kullanmak değil, en az kelime ve sürede meramını anlatabilmektir.

günlük dil günlük yaşamın, yani hayatın bizzat kendisinin matematiksel bir yansımasını içinde barındırır. sakin bir gün ile yorucu bir günün, seçilen kelimelere, kullanılan kelime sayısına, gramer ihlal oranlarına etkisi de farklı olmalıdır. ancak internetle birlikte yerleşen bir yazışma kültürü de vardır ki, bu kültür günlük hayatı şekillendirir hale gelmiştir. dil hassasiyeti olan birçok insan internet dilinin yozluğundan şikayet eder. ve önemli bir kısmı da katı kurallarla müdahale etmenin, yasaklamanın ve eğitimin buna çözüm olabileceğini sanır. oysa gözden kaçan önemli bir nokta vardır. suç internette değildir. internet yalnızca iletişimi sağlayan bir araçtır. eğer dumanla haberleşme de bu kadar hızlı olsaydı, insanlar binlerce yıl öncesinden böyle bir iletişim yaşayacak ve dil de bundan payını alacaktı. dilin doğal gelişimi birkaç kişinin seyrini etkileyebileceği bir süreç değildir. fakat türkiye gibi sıradışı bazı coğrafyalarda bir sabah uyandığınızda bazı kelimelerin yasaklandığı, ve ambalajından çıkmış yeni kelimelerin onların yerini aldığını görebilirsiniz. kimi kelimeler tutar (yargı, bağlam, soyut, türev), kimileri ise ucube olarak kalır (yanıt, bay, saylav, söylev).

edinilmiş kültürün ve yerleşmiş estetik değerlerin etkisiyle bir kelimeyi normal veya anormal şeklinde değerlendirmek son derece doğaldır. yazım hatalarının yaygınlığı onları gelecekte birer kural haline getirebilir ve bir sonraki nesil buna hiç de tuhaf bakmaz. bu her zaman bir yozlaşma değildir. kitap okumak önemsizdir, günlük dil daha yücedir gibi saçma bir düşünceyi savunmuyorum. ya da dildeki kuralları unutun nasılsa değişecekler de demiyorum. vurgulamaya çalıştığım şey dilin çok sayıda insan tarafından var edilen ve yaşatılan karmaşık bir organizma olduğu ve doğal bir seyirde yaşayıp gittiği. her ne kadar bize itici gelse de birçok internet kullanıcısı eğlence’ye “eylence”, değil’e “deyil” demeye, de da bağlaçlarını ısrarla bitişik yazmaya devam ediyorlar. acaba bu yalnızca bir eğitim sorunu mu yoksa doğal bir değişime mi tanıklık ediyoruz? şimdi kullandığımız birçok kök ve ek türkçenin geçmişinde farklı şekillerdeydi. genetik değişimler biyolojik değişimlere yol açtı. ağız, çene, dil yapısı değişime uğradı ve bazı sesleri daha sık bazılarını daha az çıkarır olduk. böylece bazı sesler kaybolmaya başladı. bunun yanında öteki dillerin ve kültürlerin de dilin evrimine etkisi azımsanmayacak düzeydedir.

dilin en gerçekçi fotoğrafını çekmek için ironik şekilde kurallar yerine pratiğin önemli olduğu günlük dile odaklanılmalıdır. bir dili salt ayıklanmış kelimelerden oluşturulan metinlerin temsil etmeyeceği açıktır. insanlar zincire vurularak esaret altına alınsa da dildeki kelimeleri tutuklamak kolay değildir. çünkü dilin köklerini saldığı coğrafya yani zihinler, kıtalardan çok daha fazla yer kaplar.

Zihin mi Dilden Dil mi Zihinden?

Ocak 9, 2007 at 5:06 am | In beyin, doğal dil işleme, evrim, zihin | Leave a Comment
Tags: , , , , , , , , , ,

Dil zihnin bir yansımasıdır. En basit açıklamayla, insanlar düşüncelerini dili kullanarak diğer insanlara aktarırlar. Kişinin diğer bütün nesnelerle birlikte yer aldığı ve etkide bulunduğu gerçekler dünyasında nesneler devinim halindedir. Bu hareket zaman ekseni üzerinde, kişinin bakışı ve diğer kişilerin bakışlarıyla birlikte sonsuz sayıda “haber” doğurur. Cümleler gerçekler dünyasını izleyen zihnin ilettiği haberlerdir. Haberin diğer kişilerce de üreticisinin ilk baktığı gibi anlaşılıp anlaşılmadığını bilemeyiz. Nedeni, bunu öğrenmek için de aynı kanalı yani dili kullanmak zorunda oluşumuzdur. Böyle bir zorlamada dil karşılıklı belirsizlikler üretecektir.

Zihinleri birbirine asgari anlam unsuruyla bağlamayı hedefleyen dil, iletişimi başlatan kişinin haberi şekillendirme ve ifade etme gücü karşısında oldukça alçakgönüllü olmalıdır. Dil bir ortak kabullenmeler ve antlaşmalar bütünüdür. Adeta zihinleri birbirine anlatmaya çalışan bir arabulucudur. Zihin ise hiçbir sınırlama ya da kural kabul etmez. Ancak ikilem şudur ki, zihni bu derece güçlü ve bağımsız kılan soyutlayışa dil ile ulaşırız. Kavramlar arasındaki karmaşık ilişkileri dil olmadan ifade etmek mümkün müdür? Yanıt, sorudaki mantık hatasında gizlidir. “İfade etmek” ancak dil ile gerçekleştirilebilir. Peki, o halde soruyu şöyle soralım: Zihinde gerçekleşen soyutlamayı dilden bağımsız hale getirebilir miyiz? Buna bir yanıt aramadan önce soyutlamanın ne olduğuna bakalım.

Senaryo: İnsanlar güçlü bir dile sahip olmadıkları zamanlarda doğayla kurdukları iletişimi her nesil yeniliyorlardı. Nesnelere isim vermek, hatta sıfatlarla onları nitelemek ve temel fiillerle haberi oluşturmak doğanın bilgisine ulaşmak için yeterli değildi. Dilden bağımsız olan doğanın sistematiğini özümseyen bir yapı gerekiyordu. Bu yapı, o âna kadar aslında görünen gerçeğin ilkel bir takipçisi olmuş dilin içinden çıkacak ve dili de, onu yaratan zihni de şekillendirecekti. Algının kanallarından akıp durmakta olan verilerin bilgi makamına çıkarılmasını sağlamak için ilk basit adım atılmıştı. Nesneleri tanımak, nitelendirmek ve basit haberleri iletebilmek güçsüz bir dille mümkündü. Ancak algı yokken ya da eksikken haberi nasıl üretecek ve değerlendireceklerdi? Dilleri haberi ancak gerçekle doğrudan bir ilişkiye girerek edinmelerine ya da iletmelerine izin veriyordu. Varsayamıyorlardı ya da şeylerin durumlarını tasarlayamıyorlardı. İşte insanlık bunu başardığında çok büyük bir adım atmış oldu. Artık aktarılabilir bilgiye sahiptiler. Artık tasarılar da birer haber olabilirdi. Bu, düşüncenin doğması demekti. Böylece doğayı izlediler, öğrendiler, tasarladılar ve tecrübeleriyle tasarılarını sınayıp bilgiye ulaştılar. Ve bilimin geleneğine uygun şekilde bir şeyin başkalarınca tekrar keşfedilmesine gerek bırakmamak için bilgiyi hem aralarında yatay olarak hem de yetiştirdikleri nesillerle zamanda dikey olarak yaydılar.

Şimdi soruya geri dönelim. Üst düzey zihinsel işlevler, sınırlandırılmış ve konuşucuların ortalaması olmak gibi faydalı bir görevi üstlenmiş bir dil dışında gerçekleştirilebilir mi? Matematikçiler bununla ilgili bir girişimde bulunmuşlardı. Tabii bunu akıl yürütmeyi matematiğe yükleyerek gerçekleştirmeye çalışmışlardı. Ancak gözden kaçan şey, mantığı ve akıl yürütmeyi belirleyen zihnin deterministik olmayan bir sistemle yani dille üretilmiş olduğuydu.

Dil olmasaydı düşünce bugünkü karmaşıklığıyla var olabilir miydi? Yoksa dilden bağımsız bir düşünüş gücü mü dili doğurdu? Kısacası zihin mi dilden çıktı, dil mi zihinden?

Pi Sayısının İçinde Hayatın Anlamını Aramak

Aralık 24, 2006 at 5:12 pm | In indirgenemezlik, matematik, pi sayısı, rastgelelik, sıkıştırma algoritmaları | 7 Comments
Tags: , , , , ,

Geçenlerde fm’de pi sayısıyla ilgili ilginç bir yazı vardı. Bu yazı, Pi sayısının, irrasyonel, yani hiçbir iki sayının birbirine oranı olarak ifade edilemeyen bir sayı olması nedeniyle, sonsuz basamağının içinde, bugüne dek var olmuş ve var olabilecek her türlü bilgi örüntüsünü içerebileceğini mizahi bir dille hatırlatıyordu. Yorumlarla birlikte ne kadar az matematik bildiğimi bir kere daha keşfetmiştim. Ancak fikrimi sabitlediğim birkaç nokta oluşmuştu zihnimde. Bir kere, Pi sayısı irrasyonel olduğu kanıtlanmış birkaç sayıdan biriydi. İrrasyonelse, herhangi bir kuralla ya da algoritmayla formüle edilemiyorsa, o halde rasgele olmalıydı. Bir de rasgele olanın indirgenemez olduğu görüşü vardı ki bu görüş de beni kendine fevkalade derecede inandırıyordu. Zira bu savı deneysel olarak incelemeye de giriştim. Elimde, rasgele olduğunu kabul ettiğim ve indirgenemez olduğunu görmek istediğim Pi sayısının virgülden sonraki ondalık kısmının ilk bir milyon basamağı ve tamı tamına bir milyon karakterlik(boşluklar dâhil) bir Türkçe metin derlemi mevcuttu. Hakem olarak WinRar programını seçip, iki dosyayı da ayrı ayrı sıkıştırdım. Sonuç beni bir kez daha içimdeki sesi dinlemem gerektiğine götürdü. Derlem altıda birlik bir boyuta sıkışabilirken Pi sayısı ancak yarısına sıkışabiliyordu. Evet, rasgele olan indirgenmesi zor olandı. Ve zaten bu yüzden belli bir örüntüsü yoktu ve bilinen bir formülle ifade edilemiyordu. Derlem ise, bir dilin kurallı yapısının bir yansımasıydı ve içinde her harfin bulunma olasılığı birbirine eşit değildi. Olasılıkların ağırlıklarını kullanan sıkıştırma programı ise böyle dağılmış olasılıklı rasgele olmayan bir dizi üzerinde daha verimli çalışıyordu.

Rasgelelik, sayı dizisi üzerinde herhangi bir rakamın gelme olasılığının önceki rakamlara bağlı olmamasıdır. Ve bütün rakamların sayı dizisinde bulunma olasılığı birbirine eşit olmalıdır. Aksi takdirde bir sistemden söz ediyor olacaktık. Ancak Pi sayısının bir irrasyonel sayı olduğunu biliyoruz. O halde Pi sayısının rasgele bir sayı olduğunu neden söylemeyelim. Ha tam da şu anda matematik devreye girse de, kuşku bırakmayacak şekilde bir ispat sunabilsem, ancak buna matematiğim yetmiyor ne yazık ki. Önermelerin uyumundan yola çıkarak mantık yürütmeyle kabul ediyorum ki Pi sayısı irrasyonel ve rasgele. Deneysel sonuçlar da beni buna götürüyor. Bakın mesela Pi sayısının ilk 6 milyar basamağındaki rakamların frekans dağılımı şöyle:

0 599,963,005 kez
1 600,033,260 kez
2 599,999,169 kez
3 600,000,243 kez
4 599,957,439 kez
5 600,017,176 kez
6 600,016,588 kez
7 600,009,044 kez
8 599,987,038 kez
9 600,017,038 kez

Eğer aldığımız Pi sayısının uzunluğunu 6 milyar basamaktan sonsuz basamağa doğru götürürsek frekanslar birbirine yaklaşır, eşitleşme eğilimine girer. Limit bilgimiz bunu fısıldıyor kulağımıza.

Peki, bunlar iyi güzel de, buradan neye varırız? Buradan, eğer yeteri kadar uzun bir Pi sayısı dizisi alırsak, bu dizinin, içinde bütün rakam örüntülerini içermesi gerektiğine ulaşırız. Örüntüyle kastedilen, rakamla ifade edilebilecek her türlü bilgidir. Bu, sizin telefon numaranız da olabilir, ad ve soyadınızın rakamla kodlanmış hali de, hatta diziyi yeterince uzatırsak üniversite son sınıfta yazdığınız bitirme tezinizin virgülü noktasına kadar tamamı da. Bunlar yeterince akla uygun sonuçlar. Ama biz yeterince uzun bir Pi sayısı dizisinin içinde her şeyin olabileceği sonucuna ulaşmamış mıydık? Öyleyse, dizi içinde, bizim henüz yazmadığımız bir aşk mektubundan tutalım da, en sevdiğimiz dizilerin gelecek sezonlarının senaryo metinlerine ve gelecek hafta çekilecek sayısal loto sonuçlarına dek her türlü sır, bizim onları bulmamızı bekliyor olamaz mıydı?  İşte bu nokta da işin magazini. Ama bu saçma sorunun yanıtı evet olmalı! Yalnız hayati bir ayrıntıyı kaçırmamamız gerekli. O ayrıntı da şu: sonsuz uzunluktaki rasgele bir dizinin içinde her türlü örüntü bulunmalı fakat ona ulaşmak için onu bilmemiz gerekli! İşte hayatın formülünü ve her türlü sırrı tam da yakalayacakken bir paradoks daha çıkıyor ve bizi mat ediyor. :)

Bu durum, gözümde şöyle bir metaforu canlandırıyor: Karşımızda sonsuz odası olan bir otel var. Ve elimizde de sonsuz sayıda anahtar. Biliyoruz ki odalardan birinde her şeyin mânâsı gizli. Ancak hazine deneme-yanılma ile bulunamayacak; bu kesin.

Yine de bizi zenginleştiren platonik bir aşktır Pi. Asla nakaratı olmayan bir şarkıdır. (http://www.avoision.com/experiments/pi10k/pi10k.html). İnsanı biraz daha paranoyak yapan siyah beyaz bir filmdir. Pi, içinde her şeyi saklayan bir gizemdir.

Size, belli örüntüleri bulmayı denemeniz için Pi sayısının ilk bir milyon basamağını buradan veriyorum. İçinde her türlü altı rakamlık kombinasyonu bulmanızı garanti edebilirim eğer yanlış hesaplamıyorsam. Ama siz yine de dikkatli olun, karşınıza Pi’nin bilinemezlerle dolu karanlık, sisli vadisinden bir canavar çıkmasın! :) Hepinize bol Pi’li günler…

Hello world!

Aralık 9, 2006 at 8:05 am | In Uncategorized | Leave a Comment

WordPress.com'dan blog alın. | Theme: Pool by Borja Fernandez.
Entries and comments feeds.