Δεν απέχει πλέον πολύ ο «φυσικός διάλογος» μεταξύ ανθρώπου και «έξυπνης» μηχανής
Παρά τις μεγάλες τεχνικές δυσκολίες που πρέπει να ξεπεραστούν, σε δέκα έως είκοσι το πολύ χρόνια θα πιάνουμε πια κανονική κουβεντούλα με τις μηχανές, με τρόπο πολύ φυσικό και ανθρώπινο
Παρά τις μεγάλες τεχνικές δυσκολίες που πρέπει να ξεπεραστούν, σε δέκα έως είκοσι το πολύ χρόνια θα πιάνουμε πια κανονική κουβεντούλα με τις μηχανές, με τρόπο πολύ φυσικό και ανθρώπινο. Και στην Ελλάδα η ανάπτυξη της σχετικής τεχνολογίας βρίσκεται σε πολύ καλό επίπεδο σε σχέση με τις διεθνείς εξελίξεις.
Αυτό προκύπτει από τις συνεντεύξεις που έδωσαν στο ΑΠΕ-ΜΠΕ τρεις έλληνες ερευνητές που ζουν και εργάζονται στις ΗΠΑ πάνω σε μια από τις αιχμές της νέας τεχνολογίας: το διάλογο μεταξύ του ανθρώπου και του υπολογιστή ή όποιας άλλης «έξυπνης» μηχανής, κάτι που γίνεται ολοένα και πιο εφικτό χάρη στην τεχνητή νοημοσύνη.
Πρόκειται για τη Δήμητρα Βεργύρη, διευθύντρια του Εργαστηρίου Έρευνας και Τεχνολογίας Ομιλίας (STAR) του Ινστιτούτου SRI International στο Μένλο Παρκ της Καλιφόρνιας, τον Δημήτρη Δημητριάδη, ανώτερο ερευνητή υπεύθυνο «ανάλυσης συναισθημάτων» στην ομάδα ομιλίας και γλώσσας της Microsoft στο Σιάτλ, και τον Αλέξανδρο Παπαγγελή, κύριο ερευνητή στο τμήμα διαλογικής τεχνητής νοημοσύνης της Uber στο Σαν Φρανσίσκο.
Οι συνεντεύξεις παραχωρήθηκαν στο πλαίσιο του Διεθνούς Συνεδρίου Τεχνολογιών Ομιλίας SLT (Spoken Language Technology), που συνδιοργανώθηκε στην Αθήνα από τις 18 έως τις 21 Δεκεμβρίου από το διεθνές Ινστιτούτο Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικών (IEEE), τον μεγαλύτερο στον κόσμο οργανισμό επαγγελματιών τεχνολογίας, και το Ινστιτούτο Πληροφορικής του «Δημόκριτου».
Οι σημερινοί προσωπικοί ψηφιακοί/εικονικοί βοηθοί όπως η Siri της Apple, η Alexa της Amazon, η Cortana της Microsoft και η Google Assistant, που επιτρέπουν την περιορισμένη και μέσα σε «καλούπια» επικοινωνία του χρήστη με τις ευφυείς συσκευές (κινητό, τάμπλετ, έξυπνα ηχεία, ηλεκτρικές συσκευές, αυτοκίνητο κ.ά.), είναι απλώς η πρόγευση του μέλλοντος, όταν θα είναι πια εφικτή η πραγματοποίηση μιας πολύ πιο φυσικής συζήτησης μεταξύ ανθρώπου και μηχανής.
Σε αυτό βοηθούν οι μέθοδοι βαθιάς μάθησης (deep learning) της τεχνητής νοημοσύνης, που εφαρμόζονται πλέον ολοένα και περισσότερο στις τεχνολογίες ομιλίας.