Δημοσιεύθηκε πριν πάνω από 2 χρόνια

Στα πλαίσια του Job Fair Athens 2015 διοργανώνεται διαγωνισμός «Πρόβλεψη πιστοληπτικής συμπεριφοράς με βάση εξομοιούμενα τραπεζικά δεδομένα» από την Qualco.

Αν θέλεις να δεις και εσύ στην πράξη ό,τι έμαθες στην θεωρία, λύσε την άσκηση που έχει σχεδιάσει η εταιρεία για εσένα και διεκδίκησε μία θέση πρακτικής άσκησης στην επίλεκτη ομάδα «Intelligent Decisions» της Qualco! Δούλεψε με την ομάδα της Qualco και δοκίμασε να λύσεις σύνθετα επιχειρησιακά προβλήματα και να προβλέψεις συμπεριφορές συνδυάζοντας την αξία που κρύβει μέσα της η πληροφορία με τη χρήση προηγμένων, αυτοματοποιημένων, εργαλείων ανάλυσης.

Πάρε μέρος στο διαγωνισμό, βρες τη λύση και – ίσως – την ευκαιρία της ζωής σου!

 

Οδηγίες Συμμετοχής

Για τους σκοπούς αυτής της άσκησης, σας παραδίδονται δύο σύνολα δεδομένων δανειακού χαρτοφυλακίου («trainingdataset» και «testdataset»). Τα δεδομένα αντιπροσωπεύουν εικόνες τέλους μήνα περίπου 7000 λογαριασμών για 12 μήνες, και είναι πλασματικά (δεν αντιστοιχούν δηλαδή σε αληθινούς τραπεζικούς λογαριασμούς). Εδώ μπορείτε να βρείτε τα δεδομένα.  

Η κάθε εγγραφή των συνόλων δεδομένων αντιστοιχεί στην εικόνα ενός λογαριασμού (με μοναδικό αναγνωριστικό την τιμή του πεδίου «Λογαριασμός») στο τέλος ενός μήνα (με μοναδικό αναγνωριστικό την τιμή του πεδίου «Αριθμός μήνα»). Τα υπόλοιπα πεδία της κάθε εγγραφής περιέχουν χαρακτηριστικά του λογαριασμού τη στιγμή εκείνη, τόσο αριθμητικά (π.χ. υπόλοιπο, πληρωμές, πλήθος κινήσεων) όσο και κατηγορικά (π.χ. φύλο πελάτη, τύπος λογαριασμού). Τα τελευταία δύο πεδία της κάθε εγγραφής δηλώνουν την κατάσταση του λογαριασμού (1 για λογαριασμούς σε οριστική καθυστέρηση, 0 για μη οριστικά καθυστερημένους λογαριασμούς) για το μήνα που αντιστοιχεί στην εγγραφή, και για τρεις μήνες αργότερα, αντίστοιχα. Το τελευταίο πεδίο για το «testdataset» είναι συμπληρωμένο με λανθασμένα στοιχεία.

Ο στόχος της άσκησης είναι η δημιουργία ενός μοντέλου πρόβλεψης της κατάστασης κάθε λογαριασμού τρεις μήνες αργότερα (του τελευταίου δηλαδή πεδίου της κάθε εγγραφής) με βάση τα υπόλοιπα πεδία (ή ένα υποσύνολο αυτών). Για το σκοπό αυτό μπορείτε να χρησιμοποιήσετε οποιονδήποτε αλγόριθμο κατηγορικών προβλέψεων (classification algorithm) από τη βιβλιογραφία της στατιστικής ή του machine learning, ή από τη δική σας σκέψη ή εμπειρία, αρκεί να επιστρέφει τις προβλέψεις του με τη μορφή πιθανοτήτων: συνηθισμένοι τέτοιοι αλγόριθμοι είναι οι Logistic Regression, Naïve Bayesκαι Neural Network.

 

Για την αξιολόγηση των αποτελεσμάτων, θα μας επιστρέψετε:

  1. Το «testdataset» με το τελευταίο πεδίο συμπληρωμένο σύμφωνα με τις προβλέψεις σας, εκφρασμένες ως πιθανότητα οριστικής καθυστέρησης: για κάθε εγγραφή δηλαδή, θα δηλώσετε έναν δεκαδικό αριθμό μεταξύ 0 (μηδενική πιθανότητα οριστικής καθυστέρησης μετά τρεις μήνες) και 1 (απόλυτη σιγουριά οριστικής καθυστέρησης μετά τρεις μήνες).

  2. Κείμενο μέχρι 1500 λέξεων που θα περιγράφει συνοπτικά τη μεθοδολογία σας, καθώς και τα συμπεράσματά σας για τη συμπεριφορά των πλασματικών λογαριασμών βάσει των χαρακτηριστικών τους, όπως προκύπτει από τις παραμέτρους και τα αποτελέσματα του μοντέλου σας.

Η αξιολόγηση των ποσοτικών αποτελεσμάτων θα γίνει βάσει του δείκτη log-loss, που εκτιμά την απόσταση των προβλέψεων από την πραγματικότητα.

 

Στείλτε τις απαντήσεις σας στο info@jobfairathens.gr με την ένδειξη “Διαγωνισμός Qualco - Job Fair Athens 2015”.

Ο διαγωνισμός θα λήξει την Δευτέρα 6 Ιουλίου 2015 στις 23:59.

 

Καλή επιτυχία!