Η εξόρυξη δεδομένων είναι Έννοια, ανάλυση αλγορίθμων, σκοπός και εφαρμογή

Πίνακας περιεχομένων:

Η εξόρυξη δεδομένων είναι Έννοια, ανάλυση αλγορίθμων, σκοπός και εφαρμογή
Η εξόρυξη δεδομένων είναι Έννοια, ανάλυση αλγορίθμων, σκοπός και εφαρμογή
Anonim

Η ανάπτυξη της πληροφορικής φέρνει πρακτικά αποτελέσματα. Ωστόσο, εργασίες όπως η εύρεση, η ανάλυση και η χρήση πληροφοριών δεν έχουν λάβει ακόμη ένα αποτελεσματικό εργαλείο υψηλής ποιότητας. Υπάρχουν αναλυτικά και ποσοτικά εργαλεία, λειτουργούν πραγματικά. Αλλά μια ποιοτική επανάσταση στη χρήση των πληροφοριών δεν έχει συμβεί ακόμη.

Πολύ πριν από την έλευση της τεχνολογίας των υπολογιστών, ένα άτομο χρειαζόταν να επεξεργάζεται μεγάλες ποσότητες πληροφοριών και το αντιμετώπιζε με τον καλύτερο δυνατό τρόπο.

Η ανάπτυξη γνώσεων και δεξιοτήτων ανταποκρινόταν πάντα στις πραγματικές ανάγκες και αντιστοιχούσε στις τρέχουσες εργασίες. Η εξόρυξη δεδομένων είναι μια συλλογική ονομασία που χρησιμοποιείται για να αναφέρεται σε ένα σύνολο μεθόδων για την ανακάλυψη προηγουμένως άγνωστων, μη τετριμμένων, πρακτικά χρήσιμων και προσβάσιμων γνώσεων σε δεδομένα, απαραίτητες για τη λήψη αποφάσεων σε διάφορους τομείς της ανθρώπινης δραστηριότητας.

Άνθρωπος, νοημοσύνη, προγραμματισμός

Ένας άνθρωπος ξέρει πάντα πώς να ενεργεί σε οποιαδήποτε κατάσταση. Η άγνοια ή μια άγνωστη κατάσταση δεν τον εμποδίζει να πάρει μια απόφαση. Η αντικειμενικότητα και η λογική οποιασδήποτε ανθρώπινης απόφασης μπορεί να αμφισβητηθεί, αλλά θα γίνει αποδεκτή.

Η νοημοσύνη βασίζεται σε: κληρονομικό «μηχανισμό», επίκτητη, ενεργητική γνώση. Η γνώση εφαρμόζεται για την επίλυση προβλημάτων που προκύπτουν ενώπιον ενός ατόμου.

  1. Η νοημοσύνη είναι ένα μοναδικό σύνολο γνώσεων και δεξιοτήτων: ευκαιρίες και θεμέλια για την ανθρώπινη ζωή και εργασία.
  2. Η νοημοσύνη εξελίσσεται συνεχώς και οι ανθρώπινες ενέργειες έχουν αντίκτυπο στους άλλους ανθρώπους.

Ο προγραμματισμός είναι η πρώτη προσπάθεια επισημοποίησης της αναπαράστασης δεδομένων και της διαδικασίας δημιουργίας αλγορίθμων.

Άνθρωπος, νοημοσύνη, προγραμματισμός
Άνθρωπος, νοημοσύνη, προγραμματισμός

Η τεχνητή νοημοσύνη (AI) είναι χάσιμο χρόνου και πόρων, αλλά τα αποτελέσματα των αποτυχημένων προσπαθειών του περασμένου αιώνα στον τομέα της τεχνητής νοημοσύνης παρέμειναν στη μνήμη, χρησιμοποιήθηκαν σε διάφορα έμπειρα (ευφυή) συστήματα και μεταμορφώθηκαν, ειδικότερα, σε αλγόριθμους (κανόνες) και μαθηματική (λογική) ανάλυση δεδομένων και εξόρυξη δεδομένων.

Πληροφορίες και η συνήθης αναζήτηση λύσης

Μια συνηθισμένη βιβλιοθήκη είναι ένα αποθετήριο γνώσης και η έντυπη λέξη και τα γραφικά δεν έχουν ακόμη παραδώσει την παλάμη στην τεχνολογία των υπολογιστών. Τα βιβλία για τη φυσική, τη χημεία, τη θεωρητική μηχανική, το σχέδιο, τη φυσική ιστορία, τη φιλοσοφία, τις φυσικές επιστήμες, τη βοτανική, τα σχολικά βιβλία, τις μονογραφίες, τις εργασίες επιστημόνων, το υλικό συνεδρίων, τις εκθέσεις σχετικά με τις εργασίες ανάπτυξης κ.λπ. είναι πάντα σχετικά και αξιόπιστα.

Η Βιβλιοθήκη είναι πολλές διαφορετικές πηγές που διαφέρουνμορφή παρουσίασης υλικού, προέλευση, δομή, περιεχόμενο, στυλ παρουσίασης κ.λπ.

Βιβλιοθήκη: βιβλία, περιοδικά και άλλα έντυπα
Βιβλιοθήκη: βιβλία, περιοδικά και άλλα έντυπα

Εξωτερικά όλα είναι ορατά (αναγνώσιμα, προσβάσιμα) για κατανόηση και χρήση. Μπορείτε να λύσετε οποιοδήποτε πρόβλημα, να θέσετε σωστά την εργασία, να αιτιολογήσετε τη λύση, να γράψετε ένα δοκίμιο ή ένα εξάμηνο, να επιλέξετε υλικό για ένα δίπλωμα, να αναλύσετε πηγές για το θέμα μιας διατριβής ή μια επιστημονική και αναλυτική έκθεση.

Οποιοδήποτε πρόβλημα πληροφοριών μπορεί να λυθεί. Με τη δέουσα επιμονή και επιδεξιότητα, θα επιτευχθεί ένα ακριβές και αξιόπιστο αποτέλεσμα. Σε αυτό το πλαίσιο, η Εξόρυξη Δεδομένων είναι μια εντελώς διαφορετική προσέγγιση.

Εκτός από το αποτέλεσμα, ένα άτομο λαμβάνει "ενεργούς συνδέσμους" σε όλα όσα προβλήθηκαν κατά τη διαδικασία επίτευξης του στόχου. Οι πηγές που χρησιμοποίησε για την επίλυση του προβλήματος μπορούν να αναφερθούν και κανείς δεν θα αμφισβητήσει το γεγονός της ύπαρξης της πηγής. Αυτό δεν αποτελεί εγγύηση γνησιότητας, αλλά είναι μια σίγουρη μαρτυρία σε ποιον «αποκαλείται» η ευθύνη για τη γνησιότητα. Από αυτή την άποψη, η Εξόρυξη Δεδομένων σημαίνει μεγάλες αμφιβολίες για την αξιοπιστία και όχι "ενεργούς" συνδέσμους.

Λύνοντας πολλά προβλήματα, ένα άτομο έχει αποτελέσματα και επεκτείνει τις πνευματικές του δυνατότητες σε πολλούς «ενεργούς συνδέσμους». Εάν μια νέα εργασία «ενεργοποιεί» έναν ήδη υπάρχοντα σύνδεσμο, το άτομο θα ξέρει πώς να το λύσει: δεν χρειάζεται να ψάξετε ξανά για τίποτα.

"Ενεργός σύνδεσμος" είναι μια σταθερή συσχέτιση: πώς και τι να κάνετε σε μια συγκεκριμένη περίπτωση. Ο ανθρώπινος εγκέφαλος θυμάται αυτόματα όλα όσα του φαίνονται δυνητικά ενδιαφέροντα, χρήσιμα.ή πιθανόν να χρειαστεί στο μέλλον. Με πολλούς τρόπους, αυτό συμβαίνει σε υποσυνείδητο επίπεδο, αλλά μόλις προκύψει μια εργασία που μπορεί να συσχετιστεί με έναν «ενεργό σύνδεσμο», εμφανίζεται αμέσως στο μυαλό και θα βρεθεί μια λύση χωρίς πρόσθετη αναζήτηση πληροφοριών. Η εξόρυξη δεδομένων είναι πάντα μια επανάληψη του αλγόριθμου αναζήτησης και αυτός ο αλγόριθμος δεν αλλάζει.

Τακτική αναζήτηση: "καλλιτεχνικά" προβλήματα

Η Μαθηματική βιβλιοθήκη και η αναζήτηση πληροφοριών σε αυτήν είναι μια σχετικά αδύναμη εργασία. Η εύρεση του ενός ή του άλλου τρόπου για να λύσετε ένα ολοκλήρωμα, να δημιουργήσετε έναν πίνακα ή να εκτελέσετε την πράξη της πρόσθεσης δύο φανταστικών αριθμών είναι επίπονη, αλλά απλή. Πρέπει να ταξινομήσετε έναν αριθμό βιβλίων, πολλά από τα οποία είναι γραμμένα σε μια συγκεκριμένη γλώσσα, να βρείτε το σωστό κείμενο, να το μελετήσετε και να βρείτε την απαιτούμενη λύση.

Με την πάροδο του χρόνου, η απαρίθμηση θα γίνει οικεία και η συσσωρευμένη εμπειρία θα σας επιτρέψει να πλοηγηθείτε στις πληροφορίες της βιβλιοθήκης και σε άλλα μαθηματικά προβλήματα. Αυτός είναι ένας περιορισμένος χώρος πληροφοριών ερωτήσεων και απαντήσεων. Ένα χαρακτηριστικό γνώρισμα: μια τέτοια αναζήτηση πληροφοριών συσσωρεύει γνώση για την επίλυση παρόμοιων προβλημάτων. Η αναζήτηση πληροφοριών από ένα άτομο αφήνει ίχνη ("ενεργούς συνδέσμους") στη μνήμη του σχετικά με πιθανές λύσεις σε άλλα προβλήματα.

Στη μυθοπλασία, βρείτε την απάντηση στην ερώτηση: "Πώς ζούσαν οι άνθρωποι τον Ιανουάριο του 1248;" πολύ δύσκολο. Είναι ακόμη πιο δύσκολο να απαντήσει κανείς στο ερώτημα τι υπήρχε στα ράφια των καταστημάτων και πώς οργανώθηκε το εμπόριο τροφίμων. Ακόμα κι αν κάποιος συγγραφέας έγραψε ξεκάθαρα και άμεσα για αυτό στο μυθιστόρημά του, αν μπορούσε να βρεθεί το όνομα αυτού του συγγραφέα, τότε αμφιβολίες γιαη αξιοπιστία των ληφθέντων δεδομένων θα παραμείνει. Η αξιοπιστία είναι ένα κρίσιμο χαρακτηριστικό οποιασδήποτε ποσότητας πληροφοριών. Η πηγή, ο συγγραφέας και τα στοιχεία που αποκλείουν την αναλήθεια του αποτελέσματος είναι σημαντικά.

Αντικειμενικές συνθήκες μιας συγκεκριμένης κατάστασης

Ο άνθρωπος βλέπει, ακούει, αισθάνεται. Μερικοί ειδικοί μιλάνε άπταιστα σε ένα μοναδικό συναίσθημα - τη διαίσθηση. Η δήλωση του προβλήματος απαιτεί πληροφορίες, η διαδικασία επίλυσης του προβλήματος τις περισσότερες φορές συνοδεύεται από μια τελειοποίηση της δήλωσης του προβλήματος. Αυτό είναι το μικρότερο πρόβλημα που έρχεται με τη μεταφορά πληροφοριών στα έγκατα ενός συστήματος υπολογιστή.

Πληροφορίες στον εικονικό χώρο
Πληροφορίες στον εικονικό χώρο

Η βιβλιοθήκη και οι συνάδελφοι είναι έμμεσοι συμμετέχοντες στη διαδικασία λήψης αποφάσεων. Ο σχεδιασμός του βιβλίου (πηγή), τα γραφικά στο κείμενο, τα χαρακτηριστικά διαχωρισμού πληροφοριών σε επικεφαλίδες, υποσημειώσεις ανά φράσεις, ευρετήριο θέματος, κατάλογος πρωταρχικών πηγών - όλα προκαλούν συσχετισμούς σε ένα άτομο που επηρεάζουν έμμεσα τη διαδικασία επίλυσης το πρόβλημα.

Ο χρόνος και ο τόπος επίλυσης του προβλήματος είναι απαραίτητοι. Ένα άτομο είναι τόσο διευθετημένο που δίνει άθελά του προσοχή σε όλα όσα τον περιβάλλουν στη διαδικασία επίλυσης ενός προβλήματος. Μπορεί να αποσπά την προσοχή ή μπορεί να είναι διεγερτικό. Η εξόρυξη δεδομένων δεν θα «καταλάβει ποτέ».

Πληροφορίες στον εικονικό χώρο

Ένα άτομο ενδιαφερόταν πάντα μόνο για αξιόπιστες πληροφορίες σχετικά με ένα γεγονός, φαινόμενο, αντικείμενο, αλγόριθμο για την επίλυση ενός προβλήματος. Ο άνθρωπος πάντα φανταζόταν πώς ακριβώς μπορεί να πετύχει τον επιθυμητό στόχο.

Η εμφάνιση των υπολογιστών και των συστημάτων πληροφοριών θα έπρεπε να έχει κάνει τη ζωή πιο εύκολη για ένα άτομο, αλλά όλα έχουν γίνει πιο περίπλοκα. Οι πληροφορίες μετανάστευσαν στα έγκατα των συστημάτων υπολογιστών και εξαφανίστηκαν από τα μάτια. Για να επιλέξετε τα απαραίτητα δεδομένα, πρέπει να δημιουργήσετε έναν σωστό αλγόριθμο ή να διατυπώσετε ένα ερώτημα στη βάση δεδομένων.

Δεδομένα μέσα στο πληροφοριακό σύστημα
Δεδομένα μέσα στο πληροφοριακό σύστημα

Η ερώτηση πρέπει να είναι σωστή. Μόνο τότε μπορείτε να πάρετε μια απάντηση. Ωστόσο, οι αμφιβολίες για την αυθεντικότητα παραμένουν. Υπό αυτή την έννοια, η Εξόρυξη Δεδομένων είναι πραγματικά «ανασκαφές», είναι «εξαγωγή πληροφοριών». Έτσι είναι της μόδας να μεταφράζεται αυτή η φράση. Η ρωσική έκδοση είναι τεχνολογία εξόρυξης δεδομένων ή εξόρυξης δεδομένων.

Στα έργα των έγκυρων ειδικών, τα καθήκοντα της Εξόρυξης Δεδομένων αναφέρονται ως εξής:

  • ταξινόμηση;
  • ομαδοποίηση;
  • σύνδεση;
  • sequence;
  • forecasting.

Από την άποψη της πρακτικής που καθοδηγεί ένα άτομο στη χειρωνακτική επεξεργασία πληροφοριών, όλες αυτές οι θέσεις είναι συζητήσιμες. Σε κάθε περίπτωση, ένα άτομο επεξεργάζεται αυτόματα πληροφορίες και δεν σκέφτεται να ταξινομήσει δεδομένα, να συγκεντρώσει θεματικές ομάδες αντικειμένων (ομαδοποίηση), να αναζητήσει χρονικά μοτίβα (ακολουθία) ή να προβλέψει το αποτέλεσμα.

Όλες αυτές οι θέσεις στο ανθρώπινο μυαλό αντιπροσωπεύονται από ενεργή γνώση, που καλύπτουν περισσότερες θέσεις και χρησιμοποιούν δυναμικά τη λογική της επεξεργασίας των αρχικών δεδομένων. Το υποσυνείδητο ενός ατόμου παίζει σημαντικό ρόλο, ειδικά όταν είναι ειδικός σε έναν συγκεκριμένο τομέα γνώσης.

Παράδειγμα: Χονδρικό εμπόριο εξοπλισμού υπολογιστών

Η εργασία είναι απλή. Υπάρχουν αρκετέςδεκάδες προμηθευτές εξοπλισμού ηλεκτρονικών υπολογιστών και περιφερειακών. Κάθε ένα έχει έναν τιμοκατάλογο σε μορφή xls (αρχείο Excel), τον οποίο μπορείτε να κατεβάσετε από την επίσημη ιστοσελίδα του προμηθευτή. Απαιτείται η δημιουργία ενός πόρου Ιστού που διαβάζει αρχεία Excel, τα μετατρέπει σε πίνακες βάσεων δεδομένων και επιτρέπει στους πελάτες να επιλέξουν τα επιθυμητά προϊόντα στις χαμηλότερες τιμές.

Τα προβλήματα προκύπτουν αμέσως. Κάθε προμηθευτής προσφέρει τη δική του έκδοση της δομής και του περιεχομένου του αρχείου xls. Μπορείτε να λάβετε το αρχείο κατεβάζοντας το από τον ιστότοπο του προμηθευτή, παραγγείλοντάς το μέσω e-mail ή λαμβάνοντας έναν σύνδεσμο λήψης μέσω του προσωπικού σας λογαριασμού, δηλαδή κάνοντας επίσημη εγγραφή στον προμηθευτή.

Εικονικό Κατάστημα Υπολογιστών
Εικονικό Κατάστημα Υπολογιστών

Η λύση του προβλήματος (στην αρχή) είναι τεχνολογικά απλή. Φόρτωση αρχείων (αρχικά δεδομένα), γράφεται ένας αλγόριθμος αναγνώρισης αρχείων για κάθε προμηθευτή και τα δεδομένα τοποθετούνται σε έναν μεγάλο πίνακα αρχικών δεδομένων. Αφού ληφθούν όλα τα δεδομένα, αφού δημιουργηθεί ο μηχανισμός της συνεχούς εναλλαγής (ημερήσια, εβδομαδιαία ή κατά την αλλαγή) των νέων δεδομένων:

  • αλλαγή ποικιλίας;
  • αλλαγές τιμών;
  • διευκρίνιση της ποσότητας σε απόθεμα;
  • προσαρμογή όρων εγγύησης, προδιαγραφών κ.λπ.

Εδώ ξεκινούν τα πραγματικά προβλήματα. Το θέμα είναι ότι ο προμηθευτής μπορεί να γράψει:

  • notebook Acer;
  • notebook Asus;
  • Φορητός υπολογιστής Dell.

Μιλάμε για το ίδιο προϊόν, αλλά από διαφορετικούς κατασκευαστές. Πώς να ταιριάξετε φορητό υπολογιστή=φορητό υπολογιστή ή πώς να αφαιρέσετε τα Acer, Asus και Dell από μια σειρά προϊόντων;

Γιατο ανθρώπινο δεν είναι πρόβλημα, αλλά πώς θα «καταλάβει» ο αλγόριθμος ότι η Acer, η Asus, η Dell, η Samsung, η LG, η HP, η Sony είναι εμπορικά σήματα ή προμηθευτές; Πώς να αντιστοιχίσετε "εκτυπωτή" και εκτυπωτή, "σαρωτή" και "MFP", "αντιγραφικό" και "MFP", "ακουστικά" με "ακουστικά", "αξεσουάρ" με "αξεσουάρ";

Η δημιουργία ενός δέντρου κατηγορίας με βάση τα δεδομένα πηγής (αρχεία πηγής) αποτελεί ήδη πρόβλημα όταν πρέπει να ρυθμίσετε τα πάντα σε αυτόματη.

Δειγματοληψία δεδομένων: ανασκαφές του "φρεσκοχυμένου"

Το έργο της δημιουργίας μιας βάσης δεδομένων προμηθευτών εξοπλισμού υπολογιστών έχει επιλυθεί. Χτίστηκε ένα δέντρο κατηγοριών, λειτουργεί κοινός πίνακας με προσφορές από όλους τους προμηθευτές.

Τυπικές εργασίες εξόρυξης δεδομένων στο πλαίσιο αυτού του παραδείγματος:

  • βρείτε ένα προϊόν στη χαμηλότερη τιμή;
  • επιλέξτε το προϊόν με το χαμηλότερο κόστος και τιμή αποστολής;
  • ανάλυση προϊόντων: χαρακτηριστικά και τιμές με κριτήρια.

Στην πραγματική δουλειά ενός διευθυντή που χρησιμοποιεί δεδομένα από πολλές δεκάδες προμηθευτές, θα υπάρχουν πολλές παραλλαγές αυτών των εργασιών και ακόμη πιο πραγματικές καταστάσεις.

Για παράδειγμα, υπάρχει ένας προμηθευτής "A" που πουλά το ASUS VivoBook S15: προπληρωμή, παράδοση 5 ημέρες μετά την πραγματική παραλαβή των χρημάτων. Υπάρχει προμηθευτής "Β" του ίδιου προϊόντος του ίδιου μοντέλου: πληρωμή κατά την παραλαβή, παράδοση μετά τη σύναψη της σύμβασης εντός μιας ημέρας, η τιμή είναι μιάμιση φορά υψηλότερη.

Αρχίζει η εξόρυξη δεδομένων - "ανασκαφές". Μεταφορικές εκφράσεις: «ανασκαφές» ή «εξόρυξη δεδομένων» είναι συνώνυμες. Έχει να κάνει με το πώς να βρεις έναν λόγο για να πάρεις μια απόφαση.

Οι προμηθευτές "A" και "B" έχουν ιστορικό παραδόσεων. Βαθμόςπροπληρωμή στην πρώτη περίπτωση έναντι πληρωμής επί παραλαβής στη δεύτερη περίπτωση, λαμβάνοντας υπόψη ότι η αποτυχία παράδοσης στη δεύτερη περίπτωση είναι 65% μεγαλύτερη. Ο κίνδυνος κυρώσεων από τον πελάτη είναι υψηλότερος/μικρότερος. Πώς και τι να καθορίσετε και ποια απόφαση να λάβετε;

Από την άλλη πλευρά: η βάση δεδομένων δημιουργήθηκε από έναν προγραμματιστή και έναν διαχειριστή. Εάν ο προγραμματιστής και ο διαχειριστής έχουν αλλάξει, πώς να προσδιορίσετε την τρέχουσα κατάσταση της βάσης δεδομένων και να μάθετε πώς να τη χρησιμοποιείτε σωστά; Θα πρέπει επίσης να κάνετε εξόρυξη δεδομένων. Η Εξόρυξη Δεδομένων προσφέρει μια ποικιλία από μαθηματικές και λογικές μεθόδους που δεν ενδιαφέρονται για το είδος των δεδομένων που ερευνώνται. Αυτό δίνει τη σωστή λύση σε ορισμένες περιπτώσεις, αλλά όχι σε όλες.

Μεταβαίνοντας στην εικονικότητα και βρίσκοντας νόημα

Οι μέθοδοι εξόρυξης δεδομένων αποκτούν νόημα μόλις οι πληροφορίες εγγραφούν στη βάση δεδομένων και εξαφανιστούν από το «οπτικό πεδίο». Το εμπόριο εξοπλισμού υπολογιστών είναι ένα ενδιαφέρον έργο, αλλά είναι απλώς μια επιχείρηση. Το πόσο καλά είναι οργανωμένος στην εταιρεία εξαρτάται από την επιτυχία της.

Οι κλιματικές αλλαγές στον πλανήτη και ο καιρός σε μια συγκεκριμένη πόλη ενδιαφέρουν όλους, όχι μόνο τους επαγγελματίες ειδικούς του κλίματος. Χιλιάδες αισθητήρες λαμβάνουν μετρήσεις ανέμου, υγρασίας, πίεσης, δεδομένων από τεχνητούς δορυφόρους της Γης και υπάρχει ιστορικό δεδομένων για χρόνια και αιώνες.

Τα καιρικά δεδομένα δεν αφορούν μόνο την απόφαση εάν θα φέρετε ή όχι μια ομπρέλα στη δουλειά. Οι τεχνολογίες εξόρυξης δεδομένων είναι η ασφαλής πτήση ενός αεροσκάφους, η σταθερή λειτουργία ενός αυτοκινητόδρομου και η αξιόπιστη προμήθεια προϊόντων πετρελαίου από τη θάλασσα.

"Ακατέργαστα" δεδομένα αποστέλλονται στις πληροφορίεςΣύστημα. Τα καθήκοντα της Εξόρυξης Δεδομένων είναι να τα μετατρέψει σε ένα συστηματοποιημένο σύστημα πινάκων, να δημιουργήσει συνδέσμους, να τονίσει ομάδες ομοιογενών δεδομένων και να ανιχνεύσει μοτίβα.

Κλίμα, καιρός και ακατέργαστα δεδομένα
Κλίμα, καιρός και ακατέργαστα δεδομένα

Οι μαθηματικές και λογικές μέθοδοι από την εποχή της ποσοτικής ανάλυσης OLAP (On-line Analytical Processing) έχουν δείξει την πρακτικότητά τους. Εδώ, η τεχνολογία σάς επιτρέπει να βρείτε νόημα και να μην το χάσετε, όπως στο παράδειγμα της πώλησης εξοπλισμού υπολογιστών.

Επιπλέον, σε καθολικές εργασίες:

  • διεθνικές επιχειρήσεις;
  • διαχείριση αεροπορικών μεταφορών;
  • μελέτη των εντέρων της γης ή κοινωνικά προβλήματα (σε κρατικό επίπεδο);
  • μελέτη της επίδρασης των φαρμάκων σε έναν ζωντανό οργανισμό;
  • πρόβλεψη των συνεπειών της κατασκευής μιας βιομηχανικής επιχείρησης κ.λπ.

Οι τεχνολογίες εξόρυξης δεδομένων και η μετατροπή δεδομένων «χωρίς νόημα» σε πραγματικά δεδομένα που σας επιτρέπουν να λαμβάνετε αντικειμενικές αποφάσεις είναι η μόνη επιλογή.

Οι ανθρώπινες δυνατότητες τελειώνουν εκεί όπου υπάρχει μεγάλος όγκος ακατέργαστων πληροφοριών. Τα συστήματα εξόρυξης δεδομένων χάνουν τη χρησιμότητά τους εκεί όπου απαιτείται να βλέπει, να κατανοεί και να αισθάνεται πληροφορίες.

Λογική κατανομή λειτουργιών και αντικειμενικότητα

Άνθρωπος και υπολογιστής πρέπει να αλληλοσυμπληρώνονται - αυτό είναι αξίωμα. Η συγγραφή μιας διατριβής αποτελεί προτεραιότητα για ένα άτομο και ένα πληροφοριακό σύστημα είναι μια βοήθεια. Εδώ, τα δεδομένα που διαθέτει η τεχνολογία εξόρυξης δεδομένων είναι ευρετικά, κανόνες, αλγόριθμοι.

Η προετοιμασία εβδομαδιαίας πρόγνωσης καιρού είναι η προτεραιότητα του πληροφοριακού συστήματος. Ο άνθρωπος διαχειρίζεται τα δεδομένα, αλλά βασίζει τις αποφάσεις του στα αποτελέσματα των υπολογισμών του συστήματος. Συνδυάζει μεθόδους εξόρυξης δεδομένων, ειδική ταξινόμηση δεδομένων, χειροκίνητο έλεγχο της εφαρμογής αλγορίθμων, αυτόματη σύγκριση προηγούμενων δεδομένων, μαθηματικές προβλέψεις και πολλές γνώσεις και δεξιότητες πραγματικών ανθρώπων που εμπλέκονται στην εφαρμογή του πληροφοριακού συστήματος.

Άνθρωπος και υπολογιστής
Άνθρωπος και υπολογιστής

Η θεωρία πιθανοτήτων και οι μαθηματικές στατιστικές δεν είναι οι πιο «αγαπημένοι» και κατανοητοί τομείς γνώσης. Πολλοί ειδικοί απέχουν πολύ από αυτούς, αλλά οι μέθοδοι που αναπτύχθηκαν σε αυτούς τους τομείς δίνουν σχεδόν 100% σωστά αποτελέσματα. Με την εφαρμογή συστημάτων που βασίζονται στις ιδέες, τις μεθόδους και τους αλγόριθμους της Εξόρυξης Δεδομένων, μπορούν να ληφθούν λύσεις αντικειμενικά και αξιόπιστα. Διαφορετικά, είναι απλά αδύνατο να βρεθεί μια λύση.

Φαραώ και μυστήρια περασμένων αιώνων

Η ιστορία ξαναγράφτηκε περιοδικά:

  • κράτη - για χάρη των στρατηγικών τους συμφερόντων;
  • αυθεντικοί επιστήμονες - για χάρη των υποκειμενικών τους πεποιθήσεων.

Είναι δύσκολο να ξεχωρίσεις τι είναι αλήθεια και τι ψευδές. Η χρήση της Εξόρυξης Δεδομένων μας επιτρέπει να λύσουμε αυτό το πρόβλημα. Για παράδειγμα, η τεχνολογία κατασκευής πυραμίδων περιγράφηκε από χρονικογράφους και μελετήθηκε από επιστήμονες σε διάφορους αιώνες. Δεν υπάρχουν όλα τα υλικά στο Διαδίκτυο, δεν είναι όλα μοναδικά εδώ και πολλά δεδομένα μπορεί να μην έχουν:

  • περιγραφόμενο χρονικό σημείο;
  • χρόνος συγγραφής της περιγραφής;
  • ημερομηνίες στις οποίες βασίζεται η περιγραφή;
  • συγγραφέας, απόψεις (σύνδεσμοι) που ελήφθησαν υπόψη;
  • επιβεβαίωση αντικειμενικότητας.

Ββιβλιοθήκες, ναοί και "απροσδόκητα μέρη" μπορείτε να βρείτε χειρόγραφα από διαφορετικούς αιώνες και υλικά στοιχεία του παρελθόντος.

Ενδιαφέρων στόχος: να συνδυάσουμε τα πάντα και να αποκαλύψουμε την «αλήθεια». Χαρακτηριστικό του προβλήματος: πληροφορίες μπορούν να ληφθούν από την πρώτη περιγραφή από έναν χρονικογράφο, κατά τη διάρκεια της ζωής των Φαραώ, έως τον τρέχοντα αιώνα, στον οποίο αυτό το πρόβλημα επιλύεται με σύγχρονες μεθόδους από πολλούς επιστήμονες.

Αιτιολογία χρήσης της Εξόρυξης Δεδομένων: η χειρωνακτική εργασία δεν είναι δυνατή. Πάρα πολλές ποσότητες:

  • πηγές πληροφοριών;
  • γλώσσες αναπαράστασης;
  • ερευνητές που περιγράφουν το ίδιο πράγμα με διαφορετικούς τρόπους;
  • ημερομηνίες, συμβάντα και όροι;
  • προβλήματα συσχέτισης όρου;
  • η ανάλυση των στατιστικών ανά ομάδες δεδομένων με την πάροδο του χρόνου μπορεί να διαφέρει, κ.λπ.

Στα τέλη του περασμένου αιώνα, όταν ένα άλλο φιάσκο της ιδέας της τεχνητής νοημοσύνης έγινε προφανές όχι μόνο στον λαϊκό, αλλά και σε έναν εξελιγμένο ειδικό, εμφανίστηκε η ιδέα: «να αναδημιουργηθεί η προσωπικότητα».

Για παράδειγμα, σύμφωνα με τα έργα των Πούσκιν, Γκόγκολ, Τσέχοφ, διαμορφώνεται ένα συγκεκριμένο σύστημα κανόνων, λογικές συμπεριφοράς και δημιουργείται ένα πληροφοριακό σύστημα που μπορεί να απαντήσει σε ορισμένες ερωτήσεις όπως θα απαντούσε ένα άτομο: Πούσκιν, Γκόγκολ ή Τσέχοφ. Θεωρητικά, ένα τέτοιο έργο είναι ενδιαφέρον, αλλά στην πράξη είναι εξαιρετικά δύσκολο να εφαρμοστεί.

Ωστόσο, η ιδέα μιας τέτοιας εργασίας υποδηλώνει μια πολύ πρακτική ιδέα: "πώς να δημιουργήσετε μια έξυπνη αναζήτηση πληροφοριών." Το Διαδίκτυο είναι πολλοί αναπτυσσόμενοι πόροι, μια τεράστια βάση δεδομένων και αυτή είναι μια εξαιρετική ευκαιρία να εφαρμοστεί η εξόρυξη δεδομένων σε συνδυασμό με τον άνθρωπολογική σε μορφή κοινής ανάπτυξης.

Μηχανή και άνθρωπος μαζί
Μηχανή και άνθρωπος μαζί

Ένα μηχάνημα και ένας άντρας σε συνδυασμό είναι ένα εξαιρετικό έργο και μια αναμφισβήτητη επιτυχία στον τομέα της «αρχαιολογίας πληροφοριών», ανασκαφές υψηλής ποιότητας σε δεδομένα και αποτελέσματα που θα θέσουν κάτι σε αμφιβολία, αλλά χωρίς αμφιβολία θα σας επιτρέψουν να αποκτήσει νέες γνώσεις και θα έχει ζήτηση στην κοινωνία.

Συνιστάται: