Egérdinamika alapú felhasználó azonosítás mély neurális hálók segítségével
User authentication based on mouse dynamics using deep neural network
Keywords:
egérdinamika, reprezentáció tanulás, konvolúciós neuronhálók., egérdinamika, reprezentáció tanulás, konvolúciósAbstract
Time series can be found in almost all areas that require human cognitive processes, therefore many of their real-life applications are known. Segmenting and classifying these types of time series is one of the most challenging tasks in the field of data mining. In the majority of cases these are extremely domain specific, so very often they claim the work of a data scientist with many years of experience. Nowadays, artificial intelligence based researches are constantly moving forward at very fast pace. Deep neural networks show an effective way of solving analytically difficult problems, therefore they can be applied on time series classification.
This research deals with mouse dynamics based user authentication, using deep neural networks. To approach the state-of-the-art performance in this field, we analyzed several types of convolutional neural networks. The effect of different preprocessing methods, as well as the effect of different amount of training data on the performance of the proposed architectures were evaluated. Since training DNN models requires a lot of data, we used transfer learning. The measurements were performed using the publicly available SapiMouse dataset, collected with our own web based application. ResNet provided the best performance. Using this type of architecture we achieved 0.86 AUC based on 3 seconds of mouse movement data. Increasing the amount of data to 12 seconds resulted in 0.92 AUC on the same dataset.
Kivonat
Az idősorok majdnem minden olyan területen fellelhetők, amelyek emberi kognitív folyamatot igényelnek, ezért számos valós életbeli alkalmazásuk ismert. Az ilyen típusú adatok szegmentálása és osztályozása a legnagyobb kihívást jelentő feladatok közé tartozik az adatbányászat témakörében. A legtöbb esetben rendkívül doménspecifikusak, így nagyon sokszor egy többéves tapasztalattal rendelkező adatmérnök munkáját igénylik. Napjainkban a gépi tanulás alapú mesterséges intelligencia egyre nagyobb teret hódít. A mély neurális háló modellek analitikusan nem megoldható probléma esetében is hatékony megoldást jelentenek, így használatuk elterjedt idősoros feladatok alkalmazására is.
Kutatásunkban egérdinamika alapú viselkedési biometria segítségével történő felhasználó azonosítást végeztünk. Többféle konvolúciós neuronhálóval kísérleteztünk és megvizsgáltuk a nyers adatok előfeldolgozásának a modellek tanítására gyakorolt hatását, illetve az azonosítási rendszer teljesítményét a tanítási adatmennyiség függvényében. Mivel a mély hálós modellek megfelelő tanításához igencsak nagy mennyiségű adat szükséges, ezért tudástranszfert alkalmaztunk. A méréseket a publikusan elérhető, saját gyűjtésű SapiMouse adathalmazzal végeztük. A legjobban teljesítő neuronháló architektúrának a ResNet bizonyult, amely az adathalmaz felhasználóira mérve 0.86 AUC értéket eredményezett 3 másodpercnyi egérmozgási adat alapján. A kapott teljesítmény tovább növelhető nagyobb mennyiségű adat felhasználásával. 12 másodpercnyi egérmozgási adat alapján 0.92 AUC értéket kapunk.