1. Giriş
Düzenleyici otoriteler ve denetçiler (regulators and auditors) hâlihazırda büyük ölçekli veri analizleri için yapay zekâyı kullanıyorlar, ancak soruşturmalar ile ilgili bilgilerin çoğu yapılandırılmamış olduğundan mevcut araçlar ve süreçler eksiktir. Ancak, uyum ekipleri ve düzenleyici otoriteler büyük veri kümeleri ile başa çıkmak için eKeşif’i (eDiscovery) benimsediği gibi, düzensizlikleri tespit etmek ve sahtekârlığı önlemek için yapay zekâ ve makine öğrenimi ilkelerinden de yararlanılabilecektir.
Günümüzde neredeyse tüm düzenleyiciler, düzensizlik durumunda büyük ölçekli veri analizi için bir tür yapay zekâ kullanıyor. Denetçiler için veri madenciliği alanı metin madenciliğinden (text mining) daha iyi bilinmektedir. Veri madenciliğine iyi bir örnek finansal işlemlerin analizidir. Bu tür veri kümelerinde ilgi çekici veya hileli davranış kalıplarını bulmak için çok sayıda algoritma ve analitik yöntem mevcuttur.
Ancak tüm bilgilerin %90’ı metin belgeleri, elektronik postalar (e-posta), sosyal medya veya multimedya dosyaları biçimindeki yapılandırılmamış bilgilerdir. Veri madenciliği araçları, veri tabanlarında kullanıldığı gibi yalnızca sütun ve satır biçimindeki yapılandırılmış veriler üzerinde çalıştığından, bu bilgilerin veri tabanı veya veri madenciliği tekniklerini (data-mining tools) kullanarak analiz edilmesi mümkün değildir.
Ayrıca dolandırıcılar, denetim ve uyum algoritmalarının nasıl çalıştığı konusunda daha bilgili hale geliyor ve bu nedenle eylemlerinin işlemsel yönlerinin bu tür algoritmalar için anormallik olarak görünmediğinden emin olma eğiliminde oluyorlar. Gerçekte neler olup bittiğinin ayrıntıları genellikle yalnızca e-posta, kısa mesajlar, WhatsApp, yasal anlaşmalar, sesli mesajlar veya bir forumdaki tartışmalar gibi yardımcı bilgilerde bulunabilir.
Günümüzde denetçiler, uyum (compliance) görevlileri ve dolandırıcılık soruşturmacıları[1], incelenebilecek çok büyük miktarda dijital bilgi ile karşı karşıyadır. Çoğu durumda, tam olarak ne aradıklarını ve onu nerede bulacaklarını önceden bilmezler.
Ayrıca bireyler veya gruplar, davranışlarını ve niyetlerini gizlemek için karmaşık dijital formatlar, nadir diller veya kod sözcükleri kullanmak gibi farklı aldatma biçimlerine başvurabilirler. Etkili bir şekilde bu, dolandırıcılık soruşturmacılarının iğnenin neye benzediğini veya samanlığın nerede olduğunu bilmeden samanlıkta iğne aradıkları anlamına gelir.
Denetçilerin ve dolandırıcılık soruşturmacılarının bu kadar büyük veri toplama ile ilgili yüksek stratejik hedeflerine ulaşmak için teknolojiyi kullanmak çok önemlidir. Bu tür bir teknolojiyi kullanmanın temel sorunu, şüpheli olanı belirlemek ile denetçiler için çok fazla iş yaratacak veya masum insanları mağdur edecek çok sayıda yanlış pozitifi işaretlemek arasındaki dengeyi bulmaktır.
Bu nedenle pek çok düzenleyici kurum, metnin anlamını gerçekten anlamak ve metnin kim, nerede, ne zaman, neden, ne, nasıl ve ne kadar olduğunu belirlemek için yapay zekâ dünyasının metin madenciliği ve doğal dil işleme araçları gibi son derece doğru yöntemlere büyük ölçüde güveniyor. Uyum soruşturmaları için talep edilen veya el konulan büyük veri kümelerinin araştırılması.
2. Dolandırıcılık Soruşturmalarında Yapay Zekâdan Yararlanılması Hadisesi
Tarihsel olarak yapay zekâ çoğunlukla bir bilgisayar sistemine insan algısının farklı biçimlerini (konuşma, görme ve dil) anlamayı öğretmekle ilgilenmiştir.
Uyum denetimlerinde ele alınması gereken verilerin tümü metin araması yapılabilir nitelikte değildir. Yapay zekânın bize yardımcı olabileceği nokta burasıdır; meta veri çıkarma (normal ve adli), makine çevirisi, optik karakter tanıma (OCR), ses transkripsiyonu, görüntü ve video etiketleme [metadata extraction (normal and forensic), machine translation, optical character recognition (OCR), audio transcription, image and video tagging], derin öğrenmedeki son gelişmeler sayesinde son derece güvenilir kalite seviyelerine ulaşmıştır. Bu nedenle metin, formattan bağımsız olarak tüm elektronik verilerin içeriğini tanımlayan iyi bir ortak payda olarak kullanılabilir.
Metin madenciliği çalışması, yüksek kaliteli ve ilgili verilerin çıkarılmasının yanı sıra, yapılandırılmamış bilgilerin otomatik olarak analiz edilmesine ve metnin tamamının daha iyi aranabilir olmasını sağlamak için çeşitli matematiksel, istatistiksel, dilsel ve derin öğrenme tekniklerinin geliştirilmesi ile ilgilidir. (Burada yüksek kalite, alaka düzeyi ile yeni ve ilginç içyüzünü anlamanın elde edilmesinin birleşimi anlamına gelir.)
Metinsel bir belge, birlikte sözcükleri oluşturan ve bu sözcüklerin ifadeler oluşturmak üzere birleştirilebilen karakterleri içerir. Bunların hepsi birlikte tanımlanmış kategorileri, kavramları, anlamları veya anlamları temsil eden sözdizimsel özelliklerdir. Metin madenciliği algoritmaları tüm bu bilgileri tanıyabilir, çıkarabilir ve kullanabilir.
Metin madenciliği kullanarak kelimeleri aramak yerine sözdizimsel, anlamsal ve üst düzey dilsel kelime kalıplarını ararız. Metin madenciliği algoritmaları ile bulunmak istemeyen birini veya bir şeyi bulmak hedefleniyor.
Metnin bağlamını modelleme yeteneği, denetimlerde ve dolandırıcılık soruşturmalarında çok fazla yanlış pozitif bulmayı önlemek için hayati öneme sahiptir. Bu tür bağlamların doğru bir şekilde anlaşılmasını sağlayan algoritmalar; son yıllarda makine çevirisi, insan-makine diyalogları, adlandırılmış varlık tanıma, duygu tespiti ve hatta ortak referans ve zamir çözümü gibi karmaşık dilsel görevler gibi bağlama duyarlı NLP (natural language processing; doğal dil işleme) görevleri için derin öğrenme algoritmalarının kullanılmasındaki başarılı ilerleme nedeniyle büyük ölçüde ilerleme kaydetmiştir.
Yukarıda belirtilen ilerleme, transformatör mimarisi adı verilen yapının geliştirilmesinden kaynaklanmaktadır. Transformatör modelleri, hâlihazırda önemli miktarda dil bilgisi içeren ve nispeten az miktarda ilave eğitim gerektiren belirli görevlere ince ayar yapılabilen, önceden eğitilmiş, tekrarlayan büyük sinir ağlarına dayanmaktadır.
Transformatör mimarisinin temel bir faydası, transfer öğrenimini gerçekleştirebilme yeteneğidir. Geleneksel olarak derin öğrenme modelleri, arzu edilen bir performansa ulaşmak için büyük miktarda göreve özel eğitim verisi gerektirmektedir.
Ancak çoğu görev için bu ağları eğitmek için gereken miktarda etiketli eğitim verisine sahip değiliz. Model, geniş doğal metin kümeleriyle ön eğitim yaparak, dilin nasıl oluşturulduğuna ilişkin önemli miktarda görevle değişmeyen bilgi öğrenir. Bu modellerde zaten bulunan tüm bu bilgiler sayesinde, eğitim süreci eldeki göreve özel kalıpları öğrenmeye odaklanabilir. Çoğu istatistiksel modelde hâlâ ihtiyaç duyulandan daha fazla veri noktasına ihtiyaç olacak, ancak derin öğrenme modellerinin eğitimine sıfırdan başlansaydı gereken milyarlarca veri noktası kadar olmayacaktır.
Dönüştürücüler, önceki kelimelere ve gelecekteki kelimelere bağlı olarak geniş bir dilsel bağlam kapsamını modelleyebilir. Bunlar, deyim yerindeyse, yalnızca geçmiş bağlamı dikkate alabilen modellere göre bağlama daha duyarlıdırlar. Ayrıca bu bağlam, daha zengin bir temsile ve daha karmaşık dilsel görevlere olanak tanıyan yerleştirme vektörlerine dâhil edilir.
Dolandırıcılık soruşturmacılarının ortak bir sorunu daha vardır: Soruşturmanın başında tam olarak ne arayacaklarını bilmiyorlar. Bu tür bir iletişim için şifrelemenin kullanılması, denetçi için tehlike işareti etkisi yaratacağından, bu tür bir iletişim genellikle kod sözcükleri kullanılarak düz açık metinle yapılır. Müfettişler bu tür spesifik kod adlarını bilmiyor veya hangi şirketleri, kişileri, hesap numaralarını veya tutarları aramaları gerektiğini tam olarak bilmiyorlar. Metin madenciliği kullanarak, tüm bu tür varlıkları veya özellikleri dilsel rollerinden tanımlamak ve daha sonra bunları denetçiye sunmak üzere yapılandırılmış bir şekilde sınıflandırmak mümkündür.
Örneğin, dilsel eşleşmeler aranarak “kim kime para ödedi”, “kim kiminle konuştu” veya “kim nereye gitti” (who paid whom, who talked to whom or who traveled where) gibi kalıplar aranabilir. Daha sonra, bu tür kalıplarla eşleşen gerçek cümleler ve kelimeler, yardımcı dokümantasyonun metninden çıkarılabilir ve araştırmacıya sunulabilir. Sıklık analizi veya basit anormallik tespit yöntemleri kullanılarak meşru işlemler şüpheli işlemlerden hızla ayrılabilir veya kod sözcükleri belirlenebilir.
Denetimin türüne bağlı olarak, erken veri değerlendirmesi için ilgi çekici olabilecek farklı boyutlar bulunmaktadır: saklayıcılar, veri hacimleri, konum, zaman serileri, olaylar, işleyiş tarzı, motivasyonlar vb. 2010 tarihli bir makalede[2] de açıklandığı gibi, geleneksel araştırma yöntemleri bu tür değerlendirmelerin ilgili boyutları için rehberlik sağlayabilir: analizin temel unsurları kim, nerede, ne zaman, neden, ne, nasıl ve ne kadardır.
Adlandırılmış varlık tanıma (named entity recognition-NER) yöntemleriyle kim, nerede ve ne zaman belirlenebilir. Nedeni daha zordur, ancak kolluk kuvvetleri araştırmaları, yüksek duygu ve duyarlılık değerlerine sahip veri konumlarının aynı zamanda işleyiş şekline ilişkin motivasyon veya içyüzünü anlamalar hakkında da iyi bir gösterge sağladığını göstermektedir. Konu modelleme gibi yöntemler kullanılarak neler anlaşılabilir? Tüm bu tekniklere ilişkin iyi bir genel bakışı, Stanford Hukuk Fakültesi’nden Roland Vogl ile birlikte Büyük Veri Hukuku’na yapılan çalışmada[3] bulanabilir.
3. Sonuç
eDiscovery teknolojisi bizlere gerçek dünyadaki büyük verilerle nasıl başa çıkacağımızı öğretti. Metin madenciliği bize metinsel verilerdeki belirli ilgi kalıplarını nasıl bulacağımızı öğretti. eKeşif ve metin madenciliğinin birleşimi bize, denetimler için büyük verilerde daha da karmaşık (geçici) ilişkileri nasıl bulacağımızı öğretecek ve sonuçta algoritmalarımızı daha iyi karar desteği sağlayacak ve denetçilerin sürekli büyüyen elektronik veri kümelerimizdeki anormallikleri ve olay anlarını tespit etmelerine yardımcı olacak şekilde eğitecektir.
Bu, doğal dilin yapısını, anlamını ve karmaşıklığını anlamaya yönelik yeni yöntemlerin giderek artan bir hızla tanıtıldığı, hızla gelişen bir alandır. Bu gelişmeler, denetçilerin ve iç soruşturmacıların, bir davanın özüne mümkün olduğunca hızlı ve verimli bir şekilde ulaşabilmek için sürekli büyüyen elektronik veri setlerine ayak uydurabilmeleri için gerekli araçların ortaya çıkmasını sağlayacaktır.
[1] Bu konuda ayrıntılı bilgi için bkz. < https://www.corporatecomplianceinsights.com/the-best-questions-to-ask-during-a-fraud-interview/ >
[2] Makale için bkz. < https://discovery.ucl.ac.uk/id/eprint/1344067/1/Discovery-led%20refinement%20in%20e-discovery%20investigations%20preprint.pdf >
[3] Kitap için bkz. < https://www.e-elgar.com/shop/gbp/research-handbook-on-big-data-law-9781788972819.html >
1966 yılında, Gence-Borçalı yöresinden göç etmiş bir ailenin çocuğu olarak Ardahan/Çıldır’da doğdu [merhume Anası (1947-10 Temmuz 2023) Erzurum/Aşkale; merhum Babası ise Ardahan/Çıldır yöresindendir]. 1984 yılında yapılan sınavda Gazi Üniversitesi İktisadi ve İdari Bilimler Fakültesi Maliye bölümünü kazandı. 1985 yılında Marmara Üniversitesi İktisadi ve İdari Bilimler Fakültesi Maliye bölümüne yatay geçiş yaptı ve 1988’de Marmara Üniversitesi İktisadi ve İdari Bilimler Fakültesi Maliye bölümünü birincilikle, Fakülteyi ise 11’inci olarak bitirdi.
1997 yılında Amerika Birleşik Devletleri’nin Denver şehrinde yer alan ‘Spring International Language Center’da; 65’inci dönem müdavimi olarak 2008-2009 döneminde Milli Güvenlik Akademisi’nde (MGA) eğitim gördü ve MGA’dan dereceyle mezun oldu. MGA eğitimi esnasında ‘Sınır Aşan Sular Meselesi’, ‘Petrol Sorunu’ gibi önemli başlıklarda bilimsel çalışmalar yaptı.
Türkiye’de Yatırımların ve İstihdamın Durumu ve Mevcut Ortamın İyileştirilmesine İlişkin Öneriler (Maliye Hesap Uzmanları Vakfı Araştırma Yarışması İkincilik Ödülü);
Türk Sosyal Güvenlik Sisteminde Yaşanan Sorunlar ve Alınması Gereken Önlemler (Maliye Hesap Uzmanları Vakfı Araştırma Yarışması İkincilik Ödülü, Sevinç Akbulak ile birlikte);
Kayıp Yıllar: Türkiye’de 1980’li Yıllardan Bu Yana Kamu Borçlanma Politikaları ve Bankacılık Sektörüne Etkileri (Bankalar Yeminli Murakıpları Vakfı Eser Yarışması, Övgüye Değer Ödülü, Emre Kavaklı ve Ayça Tokmak ile birlikte);
Türkiye’de Sermaye Piyasası Araçları ve Halka Açık Anonim Şirketler (Sevinç Akbulak ile birlikte) ve Türkiye’de Reel ve Mali Sektör: Genel Durum, Sorunlar ve Öneriler (Sevinç Akbulak ile birlikte) başlıklı kitapları yayımlanmıştır.
Anonim Şirketlerde Kâr Dağıtımı Esasları ve Yedek Akçeler (Bilgi Toplumunda Hukuk, Ünal TEKİNALP’e Armağan, Cilt I; 2003), Anonim Şirketlerin Halka Açılması (Muğla Üniversitesi İktisadi ve İdari Bilimler Fakültesi Tartışma Tebliğleri Serisi II; 2004) ile Prof. Dr. Saim ÜSTÜNDAĞ’a Vefa Andacı (2020), Cilt II, Prof. Dr. Saim Üstündağ’a İthafen İlmi Makaleler (2021), Prof. Dr. Saim Üstündağ’a İthafen İlmi Makaleler II (2021), Sosyal Bilimlerde Güncel Gelişmeler (2021), Ticari İşletme Hukuku Fasikülü (2022), Ticari Mevzuat Notları (2022), Bilimsel Araştırmalar (2022), Hukuki İncelemeler (2023), Prof. Dr. Saim Üstündağ Adına Seçme Yazılar (2024), Hukuka Giriş (2024) başlıklı kitapların bazı bölümlerinin de yazarıdır.
1992 yılından beri Türkiye’de yayımlanan otuza yakın Dergi, Gazete ve Blog’da 2 bin 500’ü aşan Telif Makale ve Telif Yazı ile tamamı İngilizceden olmak üzere Türkçe Derleme ve Türkçe Çevirisi yayımlanmıştır.
1988 yılında intisap ettiği Sermaye Piyasası Kurulu’nda (SPK) uzman yardımcısı, uzman (yeterlik sınavı üçüncüsü), başuzman, daire başkanı ve başkanlık danışmanı; Özelleştirme İdaresi Başkanlığı GSM 1800 Lisansları Değerleme Komisyonunda üye olarak görev yapmış, ayrıca Vergi Konseyi’nin bazı alt çalışma gruplarında (Menkul Sermaye İratları ve Değer Artış Kazançları; Kayıt Dışı Ekonomi; Özkaynakların Güçlendirilmesi) yer almış olup; halen başuzman unvanıyla SPK’da çalışmaktadır.
Hayatı dosdoğru yaşamak ve çalışkanlık vazgeçilmez ilkeleridir. Ülkesi ‘Türkiye Cumhuriyeti’ her şeyin üstündedir.