سه چالش بانکداری و راهحل دادههای ترکیبی
به گزارش پایگاه خبری بانکداری الکترونیک، اکنون که بازیگران جدید دنیای فناوری که دادههای جدیدی را در اختیار دارند، مانند «اپل»، و بانکهای جدید، مانند «والمارت»، چشم به بازار دارند، بانکهای سنتی همچنان با این لحظه سرنوشتساز روبرو هستند که یا مسیر تغییر و تحول را پیش بگیرند یا با افول خود روبرو شوند. اما […]
به گزارش پایگاه خبری بانکداری الکترونیک، اکنون که بازیگران جدید دنیای فناوری که دادههای جدیدی را در اختیار دارند، مانند «اپل»، و بانکهای جدید، مانند «والمارت»، چشم به بازار دارند، بانکهای سنتی همچنان با این لحظه سرنوشتساز روبرو هستند که یا مسیر تغییر و تحول را پیش بگیرند یا با افول خود روبرو شوند.
اما همه این تغییرات به یک پیشنیاز بستگی دارد: دسترسی به دادههای با کیفیت مشتریان در محیطی با دسترسی صفر. البته فناوریهای افزایشدهنده حریم خصوصی (PETs) نیز قول میدهند که دقیقاً همین نوع دادهها را ارائه دهند.
این دسته از فناوریهای جدید میتوانند قفل اطلاعات موجود در دادههای مشتریان را بدون خطر شکستن حریم خصوصی باز کنند. فناوریهای افزایشدهنده حریم خصوصی با استفاده از تکنولوژیهای ناشناسسازی دادههای قدیمی، مانند رمزگذاری همومورفیک و دادههای ترکیبی، اطلاعات را از طریق فرآیند ناشناسسازی از بین نمیبرند.
مدت مدیدی است که دانشمندان و تحلیلگران دادهها با بدهبستان دادههای خصوصی زندگی میکنند. ابزارهای قدیمی ناشناسسازی دادهها با نقابدار کردن (masking) و مستعارسازی (pseudonymization) دادهها، بخشهای ارزشمند دادهها را پنهان میکنند.
این در حالی بود که یک بانک بزرگ اروپایی که در حال آزمایش برنامه بانکداری الکترونیک خود با تراکنشهای یک سنتی بود، مجبور شد با محصولی نه چندان قوی وارد بازار شود. موضوع نگرانکنندهتر اینجا بود که پوشاندن بخشهایی از دادهها، آن را به طور کامل ناشناس نمیکند.
حملات پیوسته که به طور فزایندهای نیز پیچیده میشوند، میتوانند سوژهها را در مجموعه دادههای نقابدار شناسایی کرده و حریم خصوصی مشتریان و ایمنی موسسات را به خطر بیندازند. اکنون همه بر یک موضوع توافق نظر دارند: باید در همه موارد استفاده، ابزارهای ناشناسسازی قدیمی کنار گذاشته شوند و در عوض فناوری مناسبی برای افزایش حریم خصوصی انتخاب شود.
موارد استفاده از دادههای ترکیبی در بانکداری
یکی از سادهترین و همهکارهترین فناوریهای افزایشدهنده حریم خصوصی در بانکداری، دادههای ترکیبی تولیدشده توسط هوش مصنوعی است. دادههای ترکیبی بهترینِ هر دو جهان را در اختیارتان قرار میدهند: یعنی مجموعه دادههای آماری یکسان بر اساس دادههای تولیدی که حاوی هیچ یک از نقطه دادههای اصلی نیستند.
اگرچه چیزی به عنوان راهحل ریسک صفر در حفظ حریم شخصی وجود ندارد، اما تولیدکننده دادههای ترکیبی با کیفیت میتواند حریم کاملا خصوصی را در کنار دقت بالا ارائه دهد.
بنابراین، باید وندور (vendor) یا تامینکننده کالا یا خدماتی انتخاب شود که در امور بانکی و مالی تجربه دارد. در سه حوزه اصلی میتوان از داراییهای دادههای ترکیبی استفاده کرد: توسعه هوش مصنوعی / یادگیری ماشین، تست نرمافزار و بهاشتراکگذاری دادهها.
ماشین هوشمند: هوش مصنوعی، یادگیری ماشین و تحلیل پیشرفته
توسعه هوش مصنوعی و یادگیری ماشین یکی از حوزههای مهمی است که نگرانی بانکها و موسسات مالی را برمیانگیزاند و البته دادههای ترکیبی به بیش از یک روش میتواند به آنها کمک کند. در واقع، وقتی صحبت از پرورش مدلهای هوش مصنوعی و یادگیری ماشین میشود، دادههای ترکیبی خیلی بهتر از دادههای واقعی عمل میکنند. واقعیت این است که نمیتوان مدلهای هوش مصنوعی با کیفیت و با ارزش را بدون دادههای ترکیبی ساخت.
انتظار می رود تا سال 2024، حدود 60 درصد از دادههای مورد استفاده در حوزههای تحلیل و هوش مصنوعی دادههای ترکیبی باشند. نکته جذاب آنها چیست؟ دادههای ترکیبی را میتوان به عنوان ابزار مهندسی بینش (insight engineering) در نظر گرفت.
فرآیند سنتز و ترکیب به خودی خود مبتنی بر هوش مصنوعی است، و به همین دلیل، نه تنها برای ناشناسسازی داده ها، بلکه برای تکثیر دادهها نیز قابل استفاده است. آیا نمونههای کافی از کلاهبرداری در مجموعه دادهها در دست ندارید؟ میتوانید نمونههایی با ارزش صفر را به مجموعه نمونههای اصلی اضافه کنید. آیا دادههای خیلی زیادی در دست دارید؟ زیرمجموعه بگیرید. آیا پیشبینیها به اندازه کافی دقیق نیستند؟ برای افزایش دقت میتوانید اطلاعات دامنه را از پایگاههای عمومی دادهها تزریق کنید. آیا در طول زمان در مجموعه دادهها سوگیری مشاهده شده است؟ از طریق روش ادغام و سنتز، یک محدودیت انصاف تعریف کنید. زمانی که دادههای ترکیبی پرورش داده میشوند، حتی مفهوم گریزان «هوش مصنوعی توضیحپذیر» هم به شکلی واقعگرایانه تعریف میشود.
از آنجایی که دادههای ترکیبی قابلیت افزایش و بهاشتراکگذاری را دارا هستند، همچنین میتوانند دریچهای را به سوی الگوریتمهای تصمیمگیری باز کنند، آنچه که معمولاً از آن به عنوان تفسیرپذیری محدود یاد میشود. به گفته «مککینزی»، فناوریهای هوش مصنوعی میتوانند سالانه یک تریلیون دلار ارزش اضافی برای بانکداری جهانی به ارمغان بیاورند. به زبان ساده، پذیرش معنادار هوش مصنوعی در عملیات اداره محور و مشتری محور، مساله سود و بقا است.
توسعه و آزمایش نرمافزار
محصولات دیجیتالی پیشرفته و قوی با خدمات شخصیسازیشده، یونیکورنهای طلایی هستند که بانکهای سنتی به دنبال آنها میگردند. نئوبانکها این کار را به شکل فوقالعاده خوبی انجام میدهند، علیرغم اینکه شاید حتی اقدامات آنها در حوزه امنیت و حریم خصوصی پایینتر از حد ایدهآل باشد.
بانکهای خردهفروشی سنتی نیز اغلب آزمایشگاههای مستقل ایجاد میکنند یا توسعه و آزمایش را کاملاً برونسپاری میکنند تا از شر سیستمهای قدیمی خلاص شوند که تیمهای توسعه را از ایجاد محصولات مدرن بازمیدارند. اما با این حال، میراث قدیم جزیی از ساختار دادهها است و کسی نیز منکر آن نیست.
ناگفته نماند که دادههای مشتریان در حصار بانکها محدود میشوند و ارائه دادههای آزمایشی معنیدار به تیمهای طرف سوم یا خارج از کشور به طرز دردناکی دشوار است. دادههای ترکیبی آزمایشی میتوانند مکانی برای قرارگیری دادههای تولیدی باشند و دسترسی به دادههای مشتریان و تراکنشهای قفلشده را با حفظ حریم شخصی فراهم کنند.
تولید دادههای جایگزین دستی و آموزشی کُند و گران است و محدودیت های جدی به همراه دارد. به دلیل پیچیدگی شگفتانگیز معماری دادههای قدیمی، بازآفرینی قوانین و همبستگی تجاری به صورت دستی نیز غیرممکن است.
اینجا است که هوش مصنوعی به کار میاید! مولدهای پیشرفته دادههای ترکیبی میتوانند زیرمجموعههای واقعگرایانهای را از کل پایگاههای داده ایجاد کنند، قوانین تجاری و حتی همبستگی بین جداول را حفظ کنند و تولید دادههای آزمایشی را به طور موثری خودکار کنند. خوشبختانه، آن دورانی که مجبور به استفاده از تراکنشهای جعلی یک سنتی یا بدتر از آن، دادههای تولید مواد رادیواکتیو بودیم، به پایان رسیده است.
جعبه شنی ترکیبی: بهاشتراکگذاری داده ها بدون محدودیت
دادههای ترکیبی دادههای شخصی نیستند. نسخههای ترکیبی دادههای مشتریان حاوی بینشهای دقیقی هستند، اما هیچ یک از دادههای ترکیبی شبیه به دادههای اصلی مشتریان نیستند. در نتیجه، میتوان آنها را با خیال راحت با سایر کسبوکارهای درون سازمان، تامینکنندگان خدمات تحلیلی و هوش مصنوعی و حتی طرفهای سوم در سطح جهان به اشتراک گذاشت.
توانایی بهاشتراکگذاری دادهها امروزه یکی از الزامات حیاتی برای آندسته از کسانی است که به دنبال نوآوری در بانکداری و امور مالی هستند. اگر نتوان راهحلها را بر اساس دادههای معنیدار آزمایش کرد، انتخاب تامینکنندگان میتواند فرآیندی طولانی و پرهزینه با تصمیمهای بسیار اشتباه باشد.
«جیپیمورگان» به منظور سرعت بخشیدن به فرآیندهای اثبات مفهوم (POC) و صرفه جویی در هزینههای قابل توجه ارائه دسترسی به تامینکنندگان، یک جعبه شنی از دادههای ترکیبی ایجاد کرد.
دیگران نیز همانند گروه بانکداری «ارست بنک گروپ»، منبع داخلی دادههای ترکیبی ایجاد کردند که از این طریق مهندسان میتوانند از داخل به دادهها دسترسی داشته باشند و بوروکراسی را نیز از سر راه خود بردارند. در وهله اول، به منظور دادهمحور کردن جعبه شنی، باید دسترسیهای یکپارچه به دادهها، چه از داخل چه از بیرون، داده شود.
دادههای ترکیبی برای همه چیز لازم است است. تقریبا همه چیز!
دادههای ترکیبی یکی از کاربردیترین فناوریهایی است که حفظ حریم خصوصی را افزایش میدهد، زمان استقرار را سرعت میبخشد و قابلیت استفاده بالایی دارد. با این حال، مواردی وجود دارد که دادههای ترکیبی هم نمیتوانند بر آن غالب شوند. به دلیل ماهیت فرآیند سنتز و ترکیب، شناسایی مجدد فردی از گروه اصلی غیرممکن است. این موضوع محدودیتهایی را ایجاد میکند. برای مثال، اپلیکیشنهای مخصوص ضدپولشویی باید هویت کلاهبرداران را پس از شناسایی رمزگشایی کنند، که با دادههای ترکیبی غیرممکن به نظر میرسد. با این حال، امروزه میتوان به راحتی از 15 مورد استفاده از دادههای ترکیبی در بانکداری و امور مالی استفاده کرد. پرسش این نیست که آیا بانکها باید از دادههای ترکیبی استفاده کنند یا خیر، بلکه سوال این است که نخست باید به کدام مورد رسیدگی شود.
مترجم: فرزانه اسکندریان
منبع: https://www.bankingdive.com/spons/the-3-banking-challenges-synthetic-data-is-ready-to-meet/622189/