علی قوی، کارشناس ارشد علوم داده داتا / در بسیاری از سامانههای کشف تقلب و مقابله با پولشویی، هنوز یک فرض قدیمی حاکم است؛ اینکه با بهبود مدلهای عددی و پیچیدهترکردن تحلیل تراکنشها، میتوان خطا را کاهش داد. تجربه عملی داتا در پروژههای AML نشان میدهد این فرض دیگر کار نمیکند.
با یک نگاه جامعتر متوجه میشویم که مسئله امروز، کمبود الگوریتم یا داده عددی نیست؛ مسئله، ناتوانی در درک رفتار مالی بهعنوان یک پدیده معنادار است یعنی همان رفتاری که در عدد، متن و تصویر بهطور همزمان بروز میکند.
محدودیت ذاتی تحلیل عددی در AML
تحلیلهای کلاسیک ضدپولشویی عمدتا بر ویژگیهایی مانند مبلغ، تواتر، مسیر انتقال و شبکه ارتباط حسابها متکیاند. این رویکرد برای کشف ناهنجاریهای ساده مؤثر است، اما در مواجهه با تقلبهای پیچیده، به دو مشکل جدی میرسد:
اول افزایش هشدارهای اشتباه (False Positive) و در مقام دوم ناتوانی در توضیح «چرایی» یک هشدار برای نهادهای نظارتی. در بخش قابلتوجهی از پروندههای مشکوک، مسئله نه در عدد تراکنش، بلکه در اسناد، توضیحات متنی، یا ناهمخوانیهای ظریف میان دادهها نهفته است؛ جایی که مدلهای عددی اساسا چیزی برای دیدن ندارند.
اسناد مالی فقط تصویر یا متن نیستند؛ رفتارند
در صنعت مالی، داده تصویری معمولا به معنای تصویر چهره یا صحنه نیست. موضوع، اسناد است: فاکتورها، حوالهها، مدارک هویتی، فرمهای حقوقی.OCR سالهاست متن را از تصویر استخراج میکند، اما تجربه نشان داده استخراج متن، مسئله اصلی نیست بلکه در واقع مسئله، فهم معنا و سازگاری اجزای سند با رفتار مالی ثبتشده است. مدلهای زبان–تصویر (Vision-Language Models) به طور مشخص در همین نقطه اهمیت پیدا میکنند. این مدلها امکان همترازی معنایی میان متن، ساختار بصری سند و داده تراکنشی را فراهم میکنند؛ همان راه و مسیری که در پروژههای واقعی AML، تفاوت معناداری در دقت تشخیص ایجاد میکند. نتیجه این رویکرد، شناسایی خودکار مواردی است که پیشتر تنها با بررسی انسانی قابل کشف بودند: تناقض مبلغ، تغییر الگوی سند، ناهمزمانی صدور و پرداخت، یا حتی تلاش برای بازسازی ظاهرا معتبر یک سند نامعتبر.
چرا کاهش خطای AML بدون تحلیل چندوجهی ممکن نیست؟
در داتا، تجربه عملی نشان داده که صرف بهینهسازی مدلهای عددی، به کاهش پایدار خطا منجر نمیشود. دلیل ساده است: عددها شبیه هماند، اما نیتها نه. معماریهای نوین ضدتقلب، بهجای اتکا به یک منبع داده، از تحلیل چندوجهی استفاده میکنند؛ جایی که embeddingهای عددی، متنی و تصویری در کنار هم و در لایههای تحلیلی ادغام میشوند. در این چارچوب، هشدار نه بر اساس انحراف آماری صرف، بلکه بر اساس ناهمخوانی معنایی اجزای یک رفتار مالی صادر میشود. این تغییر زاویه دید، هم دقت را افزایش میدهد و هم توضیحپذیری تصمیم را ممکن میکند.
چالش همیشگی صنعت مالی: حریم داده
اما حتی دقیقترین مدلها نیز بدون داده متنوع و گسترده، محدود میمانند. در عین حال، تجمیع مستقیم داده میان بانکها و نهادهای مالی، بهدلیل الزامات حقوقی و رگولاتوری، عملا امکانپذیر نیست. تحلیل فدرهای (Federated Analytics) پاسخی عملی به این تناقض است. در این رویکرد، داده خام هرگز جابهجا نمیشود؛ تحلیل به نزد داده میرود و تنها بازنماییهای فشرده و حفاظتشده به اشتراک گذاشته میشوند. در پروژههای ضدپولشویی، تجربه نشان داده که تحلیل فدرهای نسبت به آموزش فدرهای کلاسیک، تناسب بیشتری با الزامات امنیتی و رگولاتوری دارد؛ بهویژه زمانی که تبادل صرفا در سطح embeddingها یا آمار غیرقابلبازسازی انجام شود.
یک نگاه معماریمحور به آینده AML
از منظر داتا، معماریهای مؤثر کشف تقلب در آینده، ناگزیر ترکیبی از سه لایه خواهند بود: گراف تراکنشها برای درک روابط پنهان؛ درک چندوجهی اسناد برای فهم معنا و نیت و تحلیل فدرهای برای همافزایی امن میان نهادها. در مرکز این معماری، یک هسته تحلیلی–زبانی قرار میگیرد که وظیفهاش تنها کشف الگو نیست، بلکه توضیح تصمیم است؛ قابلیتی که بدون آن، هیچ سامانهای در محیطهای رگولاتوری قابل اتکا نخواهد بود.
آینده کشف تقلب مالی در «مدل قویتر» خلاصه نمیشود؛ در درک عمیقتر رفتار مالی نهفته است. رفتاری که در عدد، متن و تصویر بهطور همزمان شکل میگیرد و تنها با تحلیل چندوجهی و یادگیری اشتراکی قابل فهم است. بدون این تغییر پارادایم، هزینه خطا بالا میماند و اعتماد رگولاتوری شکل نمیگیرد. هوشمندی واقعی در AML، نه در دیدن بیشتر داده، بلکه در دیدن معنا بدون نقض حریم است.