Μέθοδοι επεξεργασίας αναλυτικών δεδομένων για τη στήριξη της λήψης αποφάσεων. Λειτουργική επεξεργασία αναλυτικών δεδομένων (OLAP)

3.4 Μέθοδοι επεξεργασίας αναλυτικών δεδομένων

Προκειμένου οι υφιστάμενες αποθήκες δεδομένων να συμβάλλουν στην υιοθέτηση των αποφάσεων διαχείρισης, οι πληροφορίες θα πρέπει να εκπροσωπούνται από την Analytics στη σωστή μορφή, δηλ. Πρέπει να έχει αναπτύξει εργαλεία πρόσβασης στα δεδομένα αποθετηρίου και την επεξεργασία τους.

Πολύ συχνά, τα στοιχεία και τα αναλυτικά συστήματα που δημιουργούνται στην άμεση χρήση των ατόμων λήψης αποφάσεων είναι εξαιρετικά απλή κατά τη χρήση, αλλά είναι άκαμπτα περιορισμένες στη λειτουργικότητα. Αυτά τα στατικά συστήματα ονομάζονται συστήματα πληροφοριών του κεφαλιού (IPR) ή των εκτελεστικών συστημάτων πληροφοριών (EIS). Περιέχουν πολλά αιτήματα και, αρκεί για την καθημερινή αναθεώρηση, δεν είναι σε θέση να απαντήσει σε όλες τις ερωτήσεις που μπορεί να προκύψουν κατά τη λήψη αποφάσεων. Το αποτέλεσμα ενός τέτοιου συστήματος, κατά κανόνα, είναι αναφορές πολλαπλών σελίδων, μετά από μια διεξοδική μελέτη, την οποία ο αναλυτής έχει νέα σειρά ερωτήσεων. Ωστόσο, κάθε νέο αίτημα, απρόβλεπτο κατά το σχεδιασμό ενός τέτοιου συστήματος, πρέπει να περιγράφεται επίσημα τυπικά, να κωδικοποιείται από έναν προγραμματιστή και στη συνέχεια εκτελείται. Ο χρόνος αναμονής σε αυτή την περίπτωση μπορεί να κάνει ώρες και ημέρες που δεν είναι πάντα αποδεκτές.

Λειτουργική αναλυτική επεξεργασία. Ή on-line αναλυτική επεξεργασία, το OLAP είναι το βασικό στοιχείο της οργάνωσης των αποθηκών δεδομένων. Η ιδέα OLAP περιγράφηκε το 1993 από τον Edgar Coddo και έχει τις ακόλουθες απαιτήσεις για εφαρμογές πολυδιάστατων ανάλυσης:

- πολυδιάστατη εννοιολογική παρουσίαση δεδομένων, συμπεριλαμβανομένης της πλήρους υποστήριξης των ιεραρχιών και των πολλαπλών ιεραρχιών (βασική απαίτηση OLAP) ·

- παρέχοντας στον χρήστη στα αποτελέσματα της ανάλυσης για έναν αποδεκτό χρόνο (συνήθως όχι περισσότερο από 5 δευτερόλεπτα), ακόμη και αν η τιμή είναι μικρότερη από τη λεπτομερή ανάλυση.

- την ικανότητα εφαρμογής οποιουδήποτε χαρακτηριστικού λογικής και στατιστικής ανάλυσης αυτής της αίτησης και τη διατήρησή της σε μια εύκολη στη χρήση μορφή ·

- πρόσβαση σε πολλούς παίκτες σε δεδομένα με την υποστήριξη των σχετικών μηχανισμών αποκλεισμού και των μέσων εξουσιοδοτημένης πρόσβασης ·

- την ικανότητα να αναφέρεται σε οποιεσδήποτε απαραίτητες πληροφορίες ανεξάρτητα από τη θέση του όγκου και αποθήκευσης.

Το σύστημα OLAP αποτελείται από μια ποικιλία συστατικών. Στο υψηλότερο επίπεδο προβολής, το σύστημα περιλαμβάνει μια πηγή δεδομένων, μια πολυδιάστατη βάση δεδομένων (MBD) που παρέχει τη δυνατότητα εφαρμογής του μηχανισμού αναφοράς με βάση την Olap Technology, Olap Server και τον πελάτη. Το σύστημα είναι χτισμένο στην αρχή του διακομιστή πελάτη και παρέχει πρόσβαση απομακρυσμένων και πολλών παικτών στον διακομιστή MBD.

Εξετάστε τα σύνθετα μέρη του συστήματος OLAP.

Πηγές.Η πηγή στο Olap Systems είναι ένας διακομιστής που παρέχει δεδομένα για ανάλυση. Ανάλογα με την περιοχή χρήσης του προϊόντος OLAP, η πηγή μπορεί να χρησιμεύσει ως αποθήκη δεδομένων, κληρονομική βάση δεδομένων που περιέχει γενικά δεδομένα, σύνολο

Πίνακες που συνδυάζουν οικονομικά δεδομένα ή οποιοδήποτε συνδυασμό εισηγμένων.

Αποθήκευση δεδομένων. Τα αρχικά δεδομένα συλλέγονται και τοποθετούνται στο αποθετήριο που σχεδιάζεται σύμφωνα με τις αρχές των αποθηκών δεδομένων κτιρίων. Το HD είναι μια σχεσιακή βάση δεδομένων (RBD). Ο κύριος πίνακας του HD (πίνακας πληροφοριών) περιέχει Αριθμητικές τιμές Δείκτες για τις οποίες συλλέγονται στατιστικές πληροφορίες.

Πολυδιάστατη βάση δεδομένων. Η αποθήκευση δεδομένων χρησιμεύει ως πάροχος υπηρεσιών για μια πολυδιάστατη βάση δεδομένων, η οποία είναι ένα σύνολο αντικειμένων. Οι κύριες τάξεις αυτών των αντικειμένων είναι μετρήσεις και δείκτες. Οι μετρήσεις περιλαμβάνουν πολλαπλές τιμές (παραμέτρους) στις οποίες εμφανίζεται η ευρετηρίαση δεδομένων, όπως ο χρόνος, οι περιφέρειες, ο τύπος του ιδρύματος κλπ. Κάθε μέτρηση γεμίζει με τιμές από τους αντίστοιχους πίνακες μέτρησης αποθήκευσης δεδομένων. Το σύνολο των μετρήσεων καθορίζει το χώρο της υπό εξέταση διαδικασίας. Οι δείκτες γίνονται κατανοητές από κύβους πολυδιάστατων δεδομένων (hypercubs). Το hypercube περιέχει τα ίδια τα δεδομένα, καθώς και συγκεντρωτικά ποσά των μετρήσεων που αποτελούν μέρος της ένδειξης. Οι δείκτες αποτελούν το κύριο περιεχόμενο του MBD και συμπληρώνονται σύμφωνα με τον πίνακα. Κατά μήκος κάθε άξονα υπερσύμπι, τα δεδομένα μπορούν να οργανωθούν με τη μορφή μιας ιεραρχίας που αντιπροσωπεύει διαφορετικά επίπεδα λεπτομερειών. Αυτό σας επιτρέπει να δημιουργείτε ιεραρχικές μετρήσεις για τις οποίες, κατά τη μεταγενέστερη ανάλυση, θα διεξαχθούν συσσωμάτωση ή λεπτομερώς δεδομένα. Ένα τυπικό παράδειγμα ιεραρχικής διάστασης είναι μια λίστα των εδαφικών αντικειμένων που ομαδοποιούνται από περιφέρειες, περιοχές, περιοχές.

Υπηρέτης.Το ισχύον μέρος του συστήματος OLAP είναι ένας διακομιστής OLAP. Αυτό το στοιχείο εκτελεί όλη την εργασία (ανάλογα με το μοντέλο συστήματος) και αποθηκεύει όλες τις πληροφορίες στις οποίες εξασφαλίζεται η ενεργή πρόσβαση. Η αρχιτεκτονική διακομιστή διαχειρίζεται διάφορες έννοιες. Συγκεκριμένα, το κύριο λειτουργικό χαρακτηριστικό των προϊόντων OLAP είναι η χρήση MBD ή RBD για αποθήκευση δεδομένων.

Εφαρμογή πελάτηΤα δεδομένα, δομημένα κατάλληλα και αποθηκευμένα στο MBD είναι διαθέσιμα για ανάλυση χρησιμοποιώντας την εφαρμογή πελάτη. Ο χρήστης λαμβάνει απομακρυσμένη πρόσβαση σε δεδομένα, διαμορφώνοντας πολύπλοκα ερωτήματα, δημιουργώντας αναφορές, λαμβάνοντας αυθαίρετα υποσύνολα δεδομένων. Η παραλαβή της έκθεσης μειώνεται στην επιλογή συγκεκριμένων τιμών μέτρησης και την κατασκευή της διατομής του hypercube. Το τμήμα προσδιορίζεται από τις επιλεγμένες τιμές μέτρησης. Τα δεδομένα για άλλες διαστάσεις συνοψίζονται.

Olap. Στον πελάτη και στον διακομιστή.Η ανάλυση πολλαπλών δεδομένων μπορεί να διεξαχθεί χρησιμοποιώντας διάφορα μέσα που μπορούν να χωριστούν σε προϊόντα-πελάτη και διακομιστή.

Πρόσφατα OLAP (για παράδειγμα, πίνακες περιστροφής σε επιχειρήσεις Excel 2000 των επιχειρήσεων της Microsoft ή της Promlarity των Knosys) είναι εφαρμογές που υπολογίζουν τα συγκεντρωτικά δεδομένα και τα εμφανίζουν. Στην περίπτωση αυτή, τα ίδια τα συγκεντρωτικά δεδομένα περιέχονται στην κρυφή μνήμη εντός του χώρου διευθύνσεων ενός τέτοιου OLAP.

Εάν τα αρχικά δεδομένα περιέχονται στο DBMS DBMS, ο υπολογισμός των συγκεντρωτικών δεδομένων εκτελείται από το ίδιο το OLAP. Εάν η πηγή δεδομένων πηγής είναι ένα διακομιστή DBMS, πολλά από τα κεφάλαια OLAP πελάτη αποστέλλονται στον διακομιστή αίτησης SQL και ως αποτέλεσμα, λαμβάνονται συγκεντρωτικά δεδομένα που υπολογίζονται στο διακομιστή.

Κατά κανόνα, η λειτουργικότητα OLAP εφαρμόζεται στα μέσα επεξεργασίας στατιστικών στοιχείων και σε ορισμένα υπολογιστικά φύλλα.

Πολλά εργαλεία ανάπτυξης περιέχουν βιβλιοθήκες κλάσης ή εξαρτήματα που σας επιτρέπουν να δημιουργείτε εφαρμογές που εφαρμόζουν την απλούστερη λειτουργικότητα OLAP (όπως, για παράδειγμα, ως συστατικά Cube Cube στους Borland Delphi και Borland C ++ Builder). Επιπλέον, πολλές εταιρείες προσφέρουν στοιχεία ελέγχου ActiveX και άλλες βιβλιοθήκες που εφαρμόζουν τέτοια λειτουργικότητα.

Χρησιμοποιούνται τα πλήκτρα του πελάτη, κατά κανόνα, με ένα μικρό αριθμό μετρήσεων (συνήθως όχι περισσότερο από έξι) και μια μικρή ποικιλία τιμών αυτών των παραμέτρων - καθώς τα ληφθέντα συγκεντρωτικά δεδομένα πρέπει να συμπιέζονται στον χώρο διεύθυνσης ενός παρόμοιου μέσου και ο αριθμός τους αυξάνεται εκθετικά με αύξηση του αριθμού των μετρήσεων.

Πολλά OLAP πελάτη σάς επιτρέπουν να αποθηκεύετε τα περιεχόμενα της μνήμης cache με τα συνολικά δεδομένα με τη μορφή ενός αρχείου, ώστε να μην κάνετε τον επαναπρογραμματισμό τους. Ωστόσο, αυτή η δυνατότητα χρησιμοποιείται συχνά για να αποξενώσει συγκεντρωτικά δεδομένα προκειμένου να τα μεταφέρει σε άλλους οργανισμούς ή για δημοσίευση.

Η ιδέα της αποθήκευσης μιας προσωρινής μνήμης με συγκεντρωτικά δεδομένα στον φάκελο έχει λάβει την περαιτέρω ανάπτυξή του στο Server Olap (για παράδειγμα, Oracle Express Server ή Microsoft Olap Services), στην οποία αποθηκεύουν και αλλάζουν συγκεντρωτικά δεδομένα, καθώς και υποστήριξη για την αποθήκευση που τα περιέχουν πραγματοποιούνται από ξεχωριστή εφαρμογή ή διαδικασία που ονομάζεται Olap Server. Οι εφαρμογές-πελάτες μπορούν να ζητήσουν μια παρόμοια πολυδιάστατη αποθήκευση και σε απάντηση να λαμβάνουν ορισμένα δεδομένα. Ορισμένες εφαρμογές-πελάτες μπορούν επίσης να δημιουργήσουν καταστήματα όπως αυτά ή να τα ενημερώσουν σύμφωνα με τα δεδομένα αλλαγής πηγής.

Τα πλεονεκτήματα της εφαρμογής OLAP διακομιστή σε σύγκριση με τα εργαλεία OLAP του πελάτη είναι παρόμοια με τα πλεονεκτήματα εφαρμογής DBMS διακομιστή σε σύγκριση με τους επιτραπέζιους υπολογιστές: εάν χρησιμοποιούνται εργαλεία διακομιστή, ο υπολογισμός και η αποθήκευση συγκεντρωτικών δεδομένων εμφανίζονται στο διακομιστή και η εφαρμογή πελάτη λαμβάνει μόνο τα αποτελέσματα του Τα αιτήματα τους, τα οποία επιτρέπει στη γενική περίπτωση, μειώνουν την κυκλοφορία δικτύου, τις απαιτήσεις του χρόνου και τις απαιτήσεις των πόρων που καταναλώνονται από την αίτηση πελάτη.

3.5 Τεχνικές πτυχές της πολυδιάστατης αποθήκευσης

Η πολυδιάστατη σε εφαρμογές OLAP μπορεί να χωριστεί σε τρία επίπεδα:

1. Αναπροσαρμογή πολυδιάστατων δεδομένων - Εργαλεία τελικού χρήστη που παρέχουν πολυδιάστατη απεικόνιση και χειρισμό δεδομένων. Το πολυδιάστατο στρώμα αναπαράστασης είναι απογοητευμένο από τη δομή των φυσικών δεδομένων και αντιλαμβάνεται τα δεδομένα ως πολυδιάστατα.

    Πολυδιάστατη θεραπεία - Μέσα (γλώσσα) της διαμόρφωσης πολυδιάστατων ερωτημάτων (η παραδοσιακή σχεσιακή γλώσσα SQL εδώ είναι ακατάλληλη) και ο επεξεργαστής που μπορεί να επεξεργαστεί και να εκτελέσει ένα τέτοιο αίτημα.

    Πολυδιάστατο αποθήκευση - Εργαλεία της οργάνωσης των φυσικών δεδομένων που εξασφαλίζουν την αποτελεσματική εφαρμογή πολυδιάστατων αιτήσεων.

Τα πρώτα δύο επίπεδα είναι απαραίτητα παρόντα σε όλα τα εργαλεία OLAP. Το τρίτο επίπεδο, αν και είναι ευρέως διαδεδομένο, δεδομένου ότι τα δεδομένα για πολυδιάστατη αναπαράσταση μπορούν να αφαιρεθούν από τις συνήθεις σχεσιακές δομές. Ο πολυδιάστατος επεξεργαστής ερωτημάτων, στην περίπτωση αυτή, μεταφράζει τα πολυδιάστατα αιτήματα στα ερωτήματα SQL που εκτελούνται από σχεσιακά DBMs.

Σε οποιαδήποτε αποθήκη δεδομένων - τόσο στο συνηθισμένο όσο και σε ένα πολυδιάστατο - μαζί με λεπτομερή στοιχεία που εξάγονται από λειτουργικά συστήματα, και οι δύο συγκεντρωτικοί δείκτες αποθηκεύονται (συνολικοί δείκτες), όπως ο όγκος των πωλήσεων κατά μήνα, ανά κατηγορίες αγαθών κλπ. Τα συσσωματώματα αποθηκευμένα ρητά με τον μοναδικό σκοπό - να επιταχυνθεί η εκτέλεση των αιτήσεων. Μετά από όλα, αφενός, η αποθήκευση συσσωρεύεται, κατά κανόνα, ένα πολύ μεγάλο ποσό δεδομένων, και από την άλλη πλευρά, στις περισσότερες περιπτώσεις, όχι λεπτομερείς, αλλά γενικευμένοι δείκτες ενδιαφέρονται. Και αν κάθε φορά θα έπρεπε να συνοψίσουμε εκατομμύρια ατομικές πωλήσεις για το έτος για τον υπολογισμό του ποσού των πωλήσεων, η ταχύτητα πιθανότατα ήταν απαράδεκτη. Επομένως, κατά τη φόρτωση δεδομένων σε πολυδιάστατες βάσεις δεδομένων, όλοι οι συνολικοί δείκτες ή το τμήμα τους υπολογίζονται και αποθηκεύονται.

Ωστόσο, η χρήση συγκεντρωτικών δεδομένων είναι γεμάτη με μειονεκτήματα. Τα κύρια μειονεκτήματα αποτελούν αύξηση του όγκου των αποθηκευμένων πληροφοριών (όταν προστίθενται νέες μετρήσεις, η ποσότητα των στοιχείων δεδομένων του κύβου αυξάνεται εκθετικά) και το χρόνο λήψης. Επιπλέον, η ποσότητα των πληροφοριών μπορεί να αυξηθεί σε δεκάδες και ακόμη και εκατοντάδες φορές. Για παράδειγμα, σε μία από τις δημοσιευμένες τυποποιημένες δοκιμές, η πλήρης αξιολόγηση των συσσωματωμάτων για 10 MB απαιτούμενα δεδομένα πηγής 2,4 GB, δηλ. Τα δεδομένα αυξήθηκαν 240 φορές!

Ο βαθμός αύξησης της ποσότητας των δεδομένων στον υπολογισμό των μονάδων εξαρτάται από τον αριθμό των μετρήσεων του κύβου και της δομής αυτών των μετρήσεων, δηλ., Ο λόγος του αριθμού των "γονέων" και "απόγονοι" σε διαφορετικά επίπεδα μέτρησης. Για την επίλυση του προβλήματος της αποθήκευσης των αδρανών, τα σύνθετα συστήματα ισχύουν ότι, κατά τον υπολογισμό μακριά από όλες τις πιθανές μονάδες, για να επιτευχθεί σημαντική αύξηση της απόδοσης των ερωτημάτων.

Τόσο η πηγή όσο και τα συγκεντρωτικά δεδομένα μπορούν να αποθηκευτούν είτε στο

σχεσιακές ή σε πολυδιάστατες δομές. Από την άποψη αυτή, εφαρμόζονται τρεις μέθοδοι αποθήκευσης πολυδιάστατων δεδομένων:

Molap. (Πολυδιάστατο OLAP) - Τα δεδομένα πηγής και συσσωματώματα αποθηκεύονται σε μια πολυδιάστατη βάση δεδομένων. Η αποθήκευση δεδομένων σε πολυδιάστατες δομές επιτρέπει τα δεδομένα να χειριστούν ως πολυδιάστατο πίνακα, λόγω της οποίας ο ρυθμός υπολογισμού των συνολικών τιμών είναι ο ίδιος για οποιαδήποτε μέτρηση. Ωστόσο, στην περίπτωση αυτή, η πολυδιάστατη βάση δεδομένων είναι περιττή, δεδομένου ότι τα πολυδιάστατα δεδομένα περιέχουν πλήρως δεδομένα πηγής.

Αυτά τα συστήματα παρέχουν έναν πλήρη κύκλο επεξεργασίας OLAP. Περιλαμβάνουν, εκτός από το στοιχείο του διακομιστή, η δική τους ενσωματωμένη διεπαφή πελάτη χρησιμοποιείται είτε για να επικοινωνήσει με τα εξωτερικά προγράμματα εργασίας χρήστη με υπολογιστικά φύλλα.

Rolap. (Σχεσιακή OLAP) - Τα αρχικά δεδομένα παραμένουν στην ίδια σχεσιακή βάση δεδομένων, όπου ήταν αρχικά και ήταν. Τα συνολικά δεδομένα τοποθετούνται στους πίνακες υπηρεσίας που δημιουργούνται ειδικά για την αποθήκευση στην ίδια βάση δεδομένων.

Ίδιος. (Υβριδικό OLAP) - Τα αρχικά δεδομένα παραμένουν στην ίδια σχεσιακή βάση δεδομένων, όπου αρχικά διατηρούνται και τα συγκεντρωτικά δεδομένα αποθηκεύονται σε μια πολυδιάστατη βάση δεδομένων.

Ορισμένα OLAP υποστηρίζουν την αποθήκευση δεδομένων μόνο σε σχεσιακές δομές, μερικοί είναι μόνο σε πολυδιάστατο. Ωστόσο, τα περισσότερα σύγχρονα κεφάλαια OLAP Server υποστηρίζουν και τις τρεις μεθόδους αποθήκευσης. Η επιλογή της μεθόδου αποθήκευσης εξαρτάται από το μέγεθος και τη δομή των δεδομένων προέλευσης, τις απαιτήσεις για την ταχύτητα εκτέλεσης των αιτήσεων και τη συχνότητα ενημέρωσης των κύβων OLAP.

3.6 Ευφυής ανάλυση δεδομένων (Δεδομένα.Εξόρυξη.)

Ο όρος εξόρυξη δεδομένων υποδηλώνει τη διαδικασία εύρεσης συσχετισμών, τάσεων και σχέσεων μέσω διαφόρων μαθηματικών και στατιστικών αλγορίθμων: ανάλυση ομαδοποίησης, παλινδρόμησης και συσχέτισης κ.λπ. για συστήματα λήψης αποφάσεων. Ταυτόχρονα, οι συσσωρευμένες πληροφορίες συνοψίζονται αυτόματα σε πληροφορίες που μπορούν να χαρακτηριστούν ως γνώση.

Η βάση της σύγχρονης εξόρυξης δεδομένων τεχνολογίας βασίζεται στην έννοια των προτύπων που αντανακλά τα πρότυπα που είναι εγγενή σε δεδομένα υποβολής δεδομένων και συνιστωσών της λεγόμενης κρυφής γνώσης.

Η αναζήτηση προτύπων γίνεται με μεθόδους που δεν χρησιμοποιούν καμία προτεραιότητα σχετικά με αυτά τα υποβρύχια. Ένα σημαντικό χαρακτηριστικό της εξόρυξης δεδομένων είναι μη τυποποιημένη και μη ορατότητα των επιθυμητών προτύπων. Με άλλα λόγια, τα εργαλεία εξόρυξης δεδομένων διαφέρουν από τα στατιστικά εργαλεία δεδομένων και τα εργαλεία OLAP από το γεγονός ότι αντί να ελέγχουν τους προκαθορισμένους χρήστες διασύνδεσης.

Μεταξύ των δεδομένων, βρίσκονται βάσει των διαθέσιμων δεδομένων, είναι σε θέση να βρουν ανεξάρτητα τέτοιες αλληλεξάρτηση, καθώς και να οικοδομήσουν υποθέσεις σχετικά με τη φύση τους.

Στη γενική περίπτωση, τα δεδομένα της διανοητικής ανάλυσης δεδομένων (εξόρυξη δεδομένων) αποτελούνται από τρία στάδια

    Προσδιορισμός μοτίβων (δωρεάν αναζήτηση).

    τη χρήση προσδιορισμένων μοτίβων για την πρόβλεψη άγνωστων τιμών (προγνωστική μοντελοποίηση) ·

    Ανάλυση εκτέλεσης που αποσκοπεί στον εντοπισμό και την ερμηνεία των ανωμαλιών στις κανονικότητες που βρέθηκαν.

Μερικές φορές διακρίνεται ρητά το ενδιάμεσο στάδιο της επαλήθευσης της αξιοπιστίας των κανονισμών που βρέθηκαν μεταξύ της εύρεσης και της χρήσης τους (στάδιο επικύρωσης).

Σοβαρές πέντε τυποποιημένες μορφές προτύπων που ανιχνεύονται με μεθόδους εξόρυξης δεδομένων:

1. 1.ΣυστήματαΣας επιτρέπει να επιλέξετε σταθερές ομάδες αντικειμένων, μεταξύ των οποίων υπάρχουν σιωπηρά συνδέσεις. Η συχνότητα εμφάνισης ενός ξεχωριστού αντικειμένου ή ομάδας αντικειμένων, που εκφράζεται ως ποσοστό, ονομάζεται επικράτηση. Ο χαμηλός επιπολασμός (λιγότερο από ένα χιλιοστό επί τοις εκατό) υποδηλώνει ότι μια τέτοια ένωση δεν είναι σημαντική. Οι ενώσεις καταγράφονται υπό μορφή κανόνων: ΕΝΑ.=> ΣΙ.όπου ΑΛΛΑ -δέμα ΣΕ -Συνέπεια. Για να προσδιοριστεί η σημασία του κάθε παραληφθέντος συνεταιρισμού, είναι απαραίτητο να υπολογίσετε την αξία που ονομάζεται εμπιστοσύνη ΑΛΛΑπρος την ΣΕ(ή διασύνδεση Α και Β).Η εμπιστοσύνη δείχνει πόσο συχνά πότε ΑΛΛΑΕμφανίζεται ΣΕ.Για παράδειγμα, αν d (a / b)\u003d 20%, τότε αυτό σημαίνει ότι κατά την αγορά ενός προϊόντος ΑΛΛΑΣε κάθε πέμπτη περίπτωση, τα εμπορεύματα αγοράζονται επίσης ΣΕ.

Ένα τυπικό παράδειγμα της εφαρμογής της συσχέτισης είναι η ανάλυση της δομής αγοράς. Για παράδειγμα, κατά τη διεξαγωγή μιας μελέτης σε ένα σούπερ μάρκετ, είναι δυνατόν να διαπιστωθεί ότι το 65% των τσιπ πατατών λαμβάνει επίσης την "Coca-Cola" και αν υπάρχει έκπτωση για ένα τέτοιο κιτ, το Kola αποκτάται στο 85% των περιπτώσεων. Παρόμοια αποτελέσματα είναι πολύτιμα στο σχηματισμό στρατηγικών μάρκετινγκ.

2. Υποδοχή - Αυτή είναι η μέθοδος αναγνώρισης των ενώσεων εγκαίρως. Στην περίπτωση αυτή προσδιορίζονται οι κανόνες που περιγράφουν τη συνεπή εμφάνιση ορισμένων ομάδων συμβάντων. Αυτοί οι κανόνες είναι απαραίτητοι για την οικοδόμηση σεναρίων. Επιπλέον, μπορούν να χρησιμοποιηθούν, για παράδειγμα, να σχηματίσουν ένα τυπικό σύνολο προηγούμενων πωλήσεων, το οποίο μπορεί να συνεπάγεται μεταγενέστερες πωλήσεις ενός συγκεκριμένου προϊόντος.

3. Ταξινόμηση - Εργαλείο γενίκευσης. Σας επιτρέπει να μετακινηθείτε από την εξέταση μόνο αντικειμένων σε γενικευμένες έννοιες που χαρακτηρίζουν ορισμένα σύνολα αντικειμένων και επαρκούν για να αναγνωρίσουν αντικείμενα που ανήκουν σε αυτά τα colts (κλάσεις). Η ουσία της έννοιας του σχηματισμού των εννοιών είναι η εξεύρεση προτύπων που είναι εγγενείς στις τάξεις. Για να περιγράψετε αντικείμενα, χρησιμοποιούνται πολλά διαφορετικά χαρακτηριστικά (χαρακτηριστικά). Το πρόβλημα του σχηματισμού εννοιών στις χαρακτηριστικές περιγραφές διατυπώθηκε από τη Μ.Μ. Bongart. Η λύση του βασίζεται στη χρήση δύο κύριων διαδικασιών: Εκμάθηση και έλεγχος. Οι διαδικασίες μελέτης κατασκευάζονται από έναν κανόνα ταξινόμησης που βασίζεται στην επεξεργασία ενός σύνολο μαθησιακών αντικειμένων. Η διαδικασία επαλήθευσης (εξέταση) είναι η χρήση του ληφθέντος κανόνα ταξινόμησης για να αναγνωρίσει αντικείμενα από το νέο δείγμα (εξέτασης). Εάν τα αποτελέσματα των δοκιμών αναγνωρίζονται ως ικανοποιητικά, τότε η διαδικασία μάθησης τελειώνει, διαφορετικά ο κανόνας ταξινόμησης καθορίζεται στη διαδικασία επανεξέτασης.

4. Θερμοποίηση - Αυτή είναι η κατανομή των πληροφοριών (αρχεία) από τη βάση δεδομένων για ομάδες (συμπλέγματα) ή τμήματα με τον ταυτόχρονο ορισμό αυτών των ομάδων. Σε αντίθεση με τα ταξινόμηση, δεν απαιτεί ένα προκαταρκτικό καθήκον των τάξεων για ανάλυση.

5. Προγνωστική χρονική σειρά Πρόκειται για ένα εργαλείο για τον προσδιορισμό των τάσεων στα χαρακτηριστικά των εξεταζόμενων αντικειμένων με την πάροδο του χρόνου. Η ανάλυση της συμπεριφοράς των χρονικών σειρών σας επιτρέπει να προβλέψετε τις τιμές των χαρακτηριστικών που μελετούν.

Για την επίλυση τέτοιων εργασιών, χρησιμοποιούνται διάφορες μέθοδοι και αλγόριθμοι εξόρυξης δεδομένων. Λόγω του γεγονότος ότι η εξόρυξη δεδομένων έχει αναπτυχθεί και αναπτύξει στη διασταύρωση των κλάδων όπως οι στατιστικές, η θεωρία των πληροφοριών, η μάθηση μηχανής, η θεωρία της βάσης δεδομένων, είναι φυσικά ότι οι περισσότεροι αλγόριθμοι και μέθοδοι εξόρυξης δεδομένων έχουν αναπτυχθεί με βάση διάφορες μεθόδους από τις διάφορες μεθόδους Αυτοί οι κλάδοι.

Από την πολλαπλή των υφιστάμενων μεθόδων έρευνας δεδομένων, μπορείτε να επιλέξετε τα εξής:

    Ανάλυση παλινδρόμησης, διασποράς και συσχέτισης(Εφαρμογή στα περισσότερα σύγχρονα στατιστικά πακέτα, ιδίως σε προϊόντα των εταιρειών SAS Institute, Statsoft κ.λπ.) ·

    Μέθοδοι ανάλυσηςΣε ένα συγκεκριμένο θέμα, με βάση εμπειρικά μοντέλα (που χρησιμοποιούνται συχνά, για παράδειγμα, σε χαμηλού κόστους ταμεία οικονομικής ανάλυσης) ·

    Αλγόριθμοι νευρωνικού δικτύου- Μέθοδος απομίμησης διαδικασιών και φαινομένων, επιτρέποντας την αναπαραγωγή πολύπλοκων εξαρτήσεων. Η μέθοδος βασίζεται στη χρήση ενός απλοποιημένου μοντέλου του βιολογικού εγκεφάλου και είναι ότι οι αρχικές παράμετροι αντιμετωπίζονται ως σήματα που μετατρέπονται σύμφωνα με τις συνδέσεις μεταξύ των "νευρώνων" και ως απάντηση, το οποίο είναι το αποτέλεσμα της ανάλυσης, θεωρείται από την ανταπόκριση ολόκληρου του δικτύου στα δεδομένα προέλευσης. Οι επικοινωνίες σε αυτή την περίπτωση δημιουργούνται χρησιμοποιώντας τη λεγόμενη εκπαίδευση δικτύου με τη δειγματοληψία ενός μεγάλου όγκου που περιέχει τόσο τα δεδομένα προέλευσης όσο και τις σωστές απαντήσεις. Τα νευρικά δίκτυα χρησιμοποιούνται ευρέως για την επίλυση εργασιών ταξινόμησης.

    Ασαφής λογικήΧρησιμοποιείται για την επεξεργασία δεδομένων με θολές τιμές αλήθειας που μπορούν να εκπροσωπούνται από μια ποικιλία γλωσσικών μεταβλητών. Η ασαφής παρουσίαση της γνώσης χρησιμοποιείται ευρέως για την επίλυση των καθηκόντων της ταξινόμησης και της πρόβλεψης, για παράδειγμα, στο σύστημα Xpertrule Miner (Attar Software Ltd, Ηνωμένο Βασίλειο), καθώς και στο AIS, Neufuz κ.λπ.

    Επαγωγικά συμπεράσματαΑφήστε να αποκτήσετε γενικεύσεις των γεγονότων που είναι αποθηκευμένες στη βάση δεδομένων. Στη διαδικασία επαγωγικής εκπαίδευσης, μπορεί να συμμετάσχει ειδικός προμήθειας υποθέσεις. Αυτή η μέθοδος καλείται μάθηση με τον δάσκαλο. Η αναζήτηση κανόνων γενίκευσης μπορεί να πραγματοποιηθεί χωρίς δάσκαλο με αυτόματη δημιουργία υποθέσεων. Στο σύγχρονο λογισμικό, κατά κανόνα, και οι δύο μέθοδοι συνδυάζονται και οι στατιστικές μέθοδοι χρησιμοποιούνται για τη δοκιμή των υποθέσεων. Ένα παράδειγμα συστήματος με τη χρήση επαγωγικών συμπερασμάτων είναι ο Xpertrule Miner, που αναπτύχθηκε από το Attar Software Ltd. (Μεγάλη Βρετανία);

    συλλογιστική με βάση Παρόμοιες περιπτώσεις(Η "πλησιέστερη γειτονική" μέθοδος) (συλλογιστική βάσει περιπτώσεων - CBR) βασίζεται στην αναζήτηση καταστάσεων, οι περιγραφές των οποίων είναι παρόμοιες με μια σειρά χαρακτηριστικών με μια δεδομένη κατάσταση. Η αρχή της αναλογίας υποδηλώνει ότι τα αποτελέσματα παρόμοιων καταστάσεων θα είναι επίσης κοντά ο ένας στον άλλο. Το μειονέκτημα αυτής της προσέγγισης έγκειται στο γεγονός ότι δεν υπάρχουν μοντέλα ή κανόνες που γενικεύουν την προηγούμενη εμπειρία. Επιπλέον, η αξιοπιστία των αποτελεσμάτων εξόδου εξαρτάται από την πληρότητα της περιγραφής των καταστάσεων, όπως και στις επαγωγικές διαδικασίες εξόδου. Παραδείγματα συστημάτων που χρησιμοποιούν CBR είναι: Εργαλεία Kate (Acknosoft, Γαλλία), Workbench Recountition Pattern (Unica, ΗΠΑ).

    Λύσεις δέντρων- τρόπος διάρθρωσης μιας εργασίας με τη μορφή ενός γραφήματος δέντρου, των οποίων οι κορυφές αντιστοιχούν στους παραγωγικούς κανόνες για την ταξινόμηση των δεδομένων ή την ανάλυση των επιπτώσεων των αποφάσεων. Αυτή η μέθοδος δίνει μια οπτική ιδέα του συστήματος ταξινόμησης κανόνων, αν δεν υπάρχουν πολλοί από αυτούς. Απλές εργασίες επιλύονται με αυτή τη μέθοδο πολύ πιο γρήγορα από τη χρήση νευρωνικών δικτύων. Για πολύπλοκα προβλήματα και για ορισμένους τύπους δεδομένων, τα δέντρα λύσεων μπορεί να είναι απαράδεκτα. Επιπλέον, αυτή η μέθοδος χαρακτηρίζεται από το πρόβλημα της σημασίας. Μία από τις συνέπειες της ιεραρχικής ομαδοποίησης των δεδομένων είναι η απουσία μεγάλου αριθμού εκπαιδευτικών παραδειγμάτων για πολλές ειδικές περιπτώσεις και ως εκ τούτου η ταξινόμηση δεν μπορεί να θεωρηθεί αξιόπιστη. Μέθοδοι αποφάσεων Τα δέντρα υλοποιούνται σε πολλά λογισμικά, δηλαδή: C5.0 (επανέναρξης, Αυστραλία), Clementine (Integral Solutions, Ηνωμένο Βασίλειο), Sipina (Πανεπιστήμιο Λυών, Γαλλία), Idis (Ανακάλυψη Πληροφοριών, ΗΠΑ).

    Εξελικτικός προγραμματισμός- αναζήτηση και παραγωγή ενός αλγορίθμου που εκφράζει την αλληλεξάρτηση των δεδομένων με βάση τον αρχικά καθορισμένο αλγόριθμο που τροποποιήθηκε κατά τη διάρκεια της διαδικασίας αναζήτησης · Μερικές φορές η αναζήτηση αλληλεξάρτησης πραγματοποιείται μεταξύ των ειδικών τύπων λειτουργιών (για παράδειγμα, πολυώνυμα).

Αλγόριθμοι περιορισμένης ακεραιότηταςΥπολογιστικές συνδυασμοί απλών λογικών συμβάντων στις υποομάδες δεδομένων.

3.7 ΕνσωμάτωσηOlap. καιΔεδομένα.Εξόρυξη.

Λειτουργική αναλυτική επεξεργασία (OLAP) και έξυπνη ανάλυση δεδομένων (εξόρυξη δεδομένων) - δύο συστατικά της διαδικασίας λήψης αποφάσεων. Ωστόσο, σήμερα, η πλειοψηφία των συστημάτων OLAP επικεντρώνεται μόνο στην παροχή πρόσβασης σε πολυδιάστατα δεδομένα και τα περισσότερα εργαλεία εξόρυξης δεδομένων που εργάζονται στον τομέα των μοτίβων ασχολούνται με μονοδιάστατες προοπτικές δεδομένων. Για να αυξηθεί η αποτελεσματικότητα της επεξεργασίας δεδομένων για τα συστήματα υποστήριξης αποφάσεων, πρέπει να συνδυαστούν αυτοί οι δύο τύποι ανάλυσης.

Επί του παρόντος, ο σύνθετος όρος "εξόρυξη δεδομένων OLAP" (πολυδιάστατη έξυπνη ανάλυση) φαίνεται να χαρακτηρίζει μια τέτοια ένωση.

Υπάρχουν τρεις κύριοι τρόποι για να σχηματίσουν "Olap Data Mining":

    "Cubing τότε εξόρυξη". Η ικανότητα να εκτελεί ευφυής ανάλυση πρέπει να εξασφαλίζεται σε οποιοδήποτε αποτέλεσμα αιτήματος σε μια πολυδιάστατη εννοιολογική αναπαράσταση, δηλαδή σε οποιοδήποτε κομμάτι οποιασδήποτε προβολής των δεικτών hypercube.

    "Ορυχείο στη συνέχεια Cubing." Όπως τα δεδομένα που εξάγονται από το αποθετήριο, τα αποτελέσματα της πνευματικής ανάλυσης θα πρέπει να υποβάλλονται σε υπερκυακτική μορφή για μεταγενέστερη πολυδιάστατη ανάλυση.

    "Cubing ενώ εξόρυξη". Αυτός ο εύκαμπτος τρόπος ενσωμάτωσης σας επιτρέπει να ενεργοποιήσετε αυτόματα τον ίδιο τύπο μηχανισμών πνευματικής επεξεργασίας έναντι του αποτελέσματος του κάθε βήματος της πολυδιάστατης ανάλυσης (μετάβαση) μεταξύ των επιπέδων γενίκευσης, η εκχύλιση ενός νέου θραύσματος υπερκαβίβασης κλπ.).

    Βαθμός 11 [κείμενο ... τους όπως και μέρος όλα Συστήματα ... Επίκουρος Καθηγητής ... Cheboksary, 2009. Όχι 10. Σ. 44 -49 ... Συγγραφείς- Μεταγλωττιστές: Ν. ... Αφηρημένηδιαλέξεις, ...

  • Εγχειρίδιο διδασκαλίας

    ... διαλέξεις. Παρασκευή Διαλέξεις μαθηματικά. Γραφή ΑφηρημένηΔιαλέξεις Διαλέξεις. Χρησιμοποιώντας ΠληροφορίεςΤεχνολογία ...

  • Και στο Kondaurov με τις ερευνητικές δραστηριότητες του Lebedev του μελλοντικού δασκάλου των μαθηματικών δημιουργικών καθηκόντων για τα στοιχειώδη μαθηματικά και τη μέθοδο της διδασκαλίας

    Εγχειρίδιο διδασκαλίας

    ... διαλέξεις. Παρασκευή Διαλέξεις μαθηματικά. Γραφή ΑφηρημένηΔιαλέξεις. Προετοιμασία οπτικών οφελών. Τεχνική ανάγνωσης Διαλέξεις. Χρησιμοποιώντας ΠληροφορίεςΤεχνολογία ...

  • M Onering Media Εκσυγχρονισμός της Επαγγελματικής Εκπαίδευσης Μάρτιος - Αύγουστος 2011

    Περίληψη

    ... 11 .08.2011 "Dead Souls-2" στο RNIM τους ... 3,11 -3,44 . ... δημόσιο Διαλέξεις ηγέτες ... Cheboksary ... και εγκεφαλικό επεισόδιο Αφηρημένη το κοινό - ... ΠληροφορίεςΣυστήματα και τεχνολογίες. ... Σύστημα Εκπαίδευση - λέει Επίκουρος Καθηγητής ... μεταγλωττιστές ... Ανταλλακτικά Βελτιώστε την πραγματική Περιεχόμενο ...

Αναλυτικές τεχνολογίες επιχειρηματικών διαδικασιών

Business Intelligence Business Intelligence (BI) συνδυάζει διάφορα μέσα και ανάλυση τεχνολογίας και επεξεργασία δεδομένων της επιχείρησης. Τα Bi-Systems δημιουργούνται με βάση αυτά τα κεφάλαια, ο σκοπός της οποίας είναι η βελτίωση της ποιότητας των πληροφοριών για τη λήψη αποφάσεων διαχείρισης.

Το BI περιλαμβάνει προϊόντα λογισμικού των ακόλουθων κλάσεων:

· Επιχειρησιακά συστήματα αναλυτικής επεξεργασίας (OLAP).

· Εργαλεία ευφυής ανάλυσης δεδομένων (DM).

Τα προϊόντα λογισμικού κάθε κλάσης εκτελούν ένα συγκεκριμένο σύνολο λειτουργιών ή λειτουργιών που χρησιμοποιούν ειδικές τεχνολογίες.

OLAP (on-line αναλυτική επεξεργασία) - Η επιχειρησιακή αναλυτική επεξεργασία είναι το όνομα ενός μη ειδικού προϊόντος, αλλά μια ολόκληρη τεχνολογία. Η βάση της έννοιας OLAP έγκειται σε μια πολυδιάστατη παρουσίαση δεδομένων.

Το 1993, ο ιδρυτής της σχεσιακής προσέγγισης στην οικοδόμηση των βάσεων δεδομένων του Edgar Codd με τους εταίρους (Edgar Codd, Mathematics and Schoultant IBM), δημοσίευσε ένα άρθρο που ξεκίνησε η Εταιρεία και με τίτλο "Olap Proonds (λειτουργική αναλυτική επεξεργασία) για τους χρήστες αναλυτών" Τα οποία 12 διατυπώθηκαν κριτήρια τεχνολογίας OLAP, στη συνέχεια, αποτελούν το κύριο περιεχόμενο της νέας και πολύ ελπιδοφόρου τεχνολογίας.

Αργότερα επανεξετάστηκαν στη δοκιμή Fasmi, η οποία καθορίζει τις απαιτήσεις για τα προϊόντα OLAP:

· Γρήγορη. Η εφαρμογή OLAP πρέπει να παρέχει ένα ελάχιστο χρόνο πρόσβασης στα αναλυτικά δεδομένα - κατά μέσο όρο περίπου 5 δευτερόλεπτα.

· Ανάλυση (ανάλυση). Η εφαρμογή OLAP θα πρέπει να δώσει στον χρήστη τη δυνατότητα να πραγματοποιεί αριθμητική και στατιστική ανάλυση.

· Κοινόχρηστη (κοινή πρόσβαση). Η εφαρμογή OLAP θα πρέπει να παρέχει ταυτόχρονα τη δυνατότητα εργασίας με πληροφορίες σε πολλούς χρήστες.

· Πολυδιάστατο (πολυδιάστατο).

· Πληροφορίες (πληροφορίες). Η εφαρμογή OLAP θα πρέπει να δώσει στον χρήστη την ευκαιρία να λάβει τις απαραίτητες πληροφορίες, στις οποίες η ηλεκτρονική αποθήκη δεδομένων δεν είναι.

Με βάση το Fasmi, μπορείτε να δώσετε τον ακόλουθο ορισμό: Olap εφαρμογές - Αυτά είναι το σύστημα γρήγορης πρόσβασης για πολλούς παίκτες σε πολυδιάστατες αναλυτικές πληροφορίες με τις δυνατότητες της αριθμητικής και στατιστικής ανάλυσης.

Η βασική ιδέα του OLAP είναι η δημιουργία πολυδιάστατων κύβων που θα είναι διαθέσιμα για αιτήματα χρήστη. Οι πολυδιάστατοι κύβοι (εικ. 5.3) βασίζονται βάσει των στοιχείων πηγής και συγκεντρωτικών δεδομένων, τα οποία μπορούν να αποθηκευτούν τόσο σε σχεσιακές όσο και σε πολυδιάστατες βάσεις δεδομένων. Επομένως, εφαρμόζονται επί του παρόντος τρεις μέθοδοι αποθήκευσης δεδομένων: Molap. (Πολυδιάστατο OLAP) Rolap. (Σχετικό OLAP) και Ίδιος. (Υβριδικό OLAP).



Κατά συνέπεια, τα προϊόντα OLAP ανά μέθοδο αποθήκευσης χωρίζονται σε τρεις παρόμοιες κατηγορίες:

1. Στην περίπτωση του Molap, τα αρχικά και πολυδιάστατα δεδομένα αποθηκεύονται σε μια πολυδιάστατη βάση δεδομένων ή σε μια πολυδιάστατη τοπική Κούβα. Αυτή η μέθοδος αποθήκευσης παρέχει Υψηλή ταχύτητα Εκτελέστε λειτουργίες OLAP. Αλλά η πολυδιάστατη βάση στην περίπτωση αυτή θα είναι συχνότερα περιττή. Ο κύβος με βάση αυτό θα εξαρτηθεί ιδιαίτερα από τον αριθμό των μετρήσεων. Με την αύξηση του αριθμού των μετρήσεων, ο όγκος του κύβου θα αναπτυχθεί εκθετικά. Μερικές φορές μπορεί να οδηγήσει σε "εκρηκτική ανάπτυξη" του όγκου των δεδομένων.

2. Στα προϊόντα Rolap, τα αρχικά δεδομένα αποθηκεύονται σε σχεσιακές βάσεις δεδομένων ή σε επίπεδη τοπικά τραπέζια στον διακομιστή αρχείων. Τα συνολικά δεδομένα μπορούν να τοποθετηθούν στους πίνακες υπηρεσίας στην ίδια βάση δεδομένων. Η μετατροπή δεδομένων από τη σχεσιακή βάση δεδομένων σε πολυδιάστατους κύβους εμφανίζεται κατόπιν αιτήματος OLAP. Σε αυτή την περίπτωση, η ταχύτητα της οικοδόμησης ενός κύβου θα εξαρτηθεί ιδιαίτερα από τον τύπο της πηγής δεδομένων.

3. Στην περίπτωση της χρήσης μιας υβριδικής αρχιτεκτονικής, τα αρχικά δεδομένα παραμένουν στη σχεσιακή βάση και οι μονάδες τοποθετούνται σε πολυδιάστατο. Η κατασκευή του κύβου OLAP πραγματοποιείται κατόπιν αιτήματος Olap-Tools με βάση τα σχετικά και πολυδιάστατα δεδομένα. Αυτή η προσέγγιση αποφεύγει την εκρηκτική ανάπτυξη των δεδομένων. Ταυτόχρονα, είναι δυνατόν να επιτευχθεί ο βέλτιστος χρόνος εκτέλεσης των αιτημάτων πελάτη.

Χρησιμοποιώντας τις τεχνολογίες OLAP, ο χρήστης μπορεί να ασκήσει ευέλικτη προβολή πληροφοριών, να αποκτήσει διαφορετικά τμήματα δεδομένων, να εκτελέσει αναλυτικές λειτουργίες λεπτομέρειας, συνέλιξης, μέσω διανομής, χρόνου σύγκρισης, δηλ. Δημιουργία και δυναμική δημοσίευση εκθέσεων και εγγράφων.

Η δομή της βάσης δεδομένων αποθήκευσης συνήθως αναπτύσσεται με τέτοιο τρόπο ώστε να μεγιστοποιηθεί η ανάλυση των πληροφοριών. Τα δεδομένα πρέπει να είναι κατάλληλα "να καθορίσουν" σε διαφορετικές κατευθύνσεις (που ονομάζονται μετρήσεις). Για παράδειγμα, σήμερα ο χρήστης θέλει να δει την περίληψη παράδοσης των προμηθευτών σε προμηθευτές για να συγκρίνει τις δραστηριότητές τους. Αύριο ο ίδιος χρήστης θα χρειαστεί μια εικόνα αλλαγών στον όγκο της παράδοσης των λεπτομερειών ανά μήνες για να εντοπίσει τη δυναμική των προμηθειών. Η δομή της βάσης δεδομένων πρέπει να εξασφαλίζει τέτοιους τύπους ανάλυσης, επιτρέποντάς σας να διαθέσετε δεδομένα που αντιστοιχεί στο καθορισμένο σύνολο μέτρησης.

Η βάση της λειτουργικής επεξεργασίας των αναλυτικών δεδομένων είναι η αρχή της οργάνωσης πληροφοριών σε ένα υπερκυκλοϊκό μοντέλο. Ο απλούστερος τρισδιάστατος κύβος για λεπτομέρειες για την προηγουμένως θεωρούμενη βάση δεδομένων δοκιμής παρουσιάζεται στο ΣΧ. 3.11. Κάθε κύτταρο αντιστοιχεί στο "γεγονός" - για παράδειγμα, ο όγκος παράδοσης του τμήματος. Κατά μήκος μιας όψης του κύβου (μία μέτρηση) υπάρχουν μήνες κατά τη διάρκεια της οποίας εκτελέστηκε ο κύβος απελευθέρωσης. Η δεύτερη διάσταση είναι οι τύποι λεπτομερειών και το τρίτο αντιστοιχεί στους προμηθευτές. Κάθε κύτταρο περιέχει την ποσότητα παράδοσης για τον αντίστοιχο συνδυασμό τιμών και για τις τρεις διαστάσεις. Πρέπει να σημειωθεί ότι κατά την συμπλήρωση του κύβου, δημιουργείται μια συσσωμάτωση τιμών για την παροχή κάθε μήνα από τη βάση δεδομένων δοκιμής.


3.11. Μια παραλλαγή ενός απλοποιημένου υπερσύρματος για την ανάλυση των προμηθειών εξαρτημάτων

Τα συστήματα κλάσης Olap διαφέρουν από τη μέθοδο αναπαράστασης δεδομένων.

Πολυδιάστατο OLAP (Molap) - Η βάση αυτών των συστημάτων είναι ένα πολυδιάστατο, βασισμένο σε δυναμικές συστοιχίες. Δομή δεδομένων με κατάλληλες μεθόδους πρόσβασης. Ο Molap εφαρμόζεται σε κατοχυρωμένες με δίπλωμα ευρεσιτεχνίας τεχνολογίες για την οργάνωση πολυδιάστατων DBMS. Το πλεονέκτημα αυτής της προσέγγισης είναι η ευκολία της εκτέλεσης υπολογιστών πάνω από τα κύτταρα του hypercube, επειδή Κάτω από όλους τους συνδυασμούς μετρήσεων, τα αντίστοιχα κύτταρα (τόσο στο υπολογιστικό φύλλο) φορτίζονται. Οι κλασικοί εκπρόσωποι αυτών των συστημάτων περιλαμβάνουν το Oracle Express, SAS ινστιτούτο MDDB.



Σχέση OLAP (Rolap) - Υποστηρίζει πολυδιάστατα αναλυτικά μοντέλα πάνω από σχεσιακές βάσεις δεδομένων. Αυτή η κατηγορία των συστημάτων περιλαμβάνει πληροφορίες Meta Cube, υπηρεσίες της Microsoft Olap, Solutions Hyperion, SAS Institute Realest Olap.

Desktop Olap (Desktop Olap)- Μέσα για τη δημιουργία πολυδιάστατων αιτήσεων και αναφορών για τοπικά συστήματα πληροφοριών (υπολογιστικά φύλλα, επίπεδη αρχεία). Μπορείτε να επιλέξετε τα ακόλουθα συστήματα - επιχειρηματικά αντικείμενα, το Cognos Power Play.

Ε.Π. Ο κώδικας ορίστηκε τους δώδεκα κανόνες που πρέπει να ικανοποιήσουν την κλάση προϊόντων OLAP, συμπεριλαμβανομένης μιας πολυδιάστατης εννοιολογικής αναπαράστασης δεδομένων, διαφάνειας, διαθεσιμότητας, βιώσιμης απόδοσης, αρχιτεκτονικής διακομιστή πελάτη, ισότητα μέτρησης, δυναμική επεξεργασία σπάνιων πινάκων, που υποστηρίζει τη λειτουργία πολλών παικτών, Διατομεαστικές εργασίες, διαισθητικό χειρισμό δεδομένων, ευέλικτο μηχανισμό παραγωγής αναφοράς, απεριόριστα επίπεδα μέτρησης και συσσωμάτωσης.



Τα πιο συνηθισμένα συστήματα της κατηγορίας Rolap. Σας επιτρέπουν να οργανώσετε Μοντέλο πληροφοριών Πάνω από τη σχεσιακή και πλήρη αποθήκευση οποιασδήποτε δομής ή σε μια ειδική περίπτωση οθόνης.

Σύκο. 3.12. Σχέδιο της αναλυτικής βιτρίνας "Star" για την παροχή εξαρτημάτων

Για τις περισσότερες αποθήκες δεδομένων, ο πιο αποτελεσματικός τρόπος μοντελοποίησης ενός Ν-διαστατικού κύβου είναι ένα αστέρι. Στο ΣΧ. 3.11 Το μοντέλο της υπερσύμβησης για την ανάλυση της παροχής εξαρτημάτων, στα οποία οι πληροφορίες ενοποιούνται σε τέσσερις διαστάσεις (προμηθευτής, λεπτομέρεια, μήνας, έτος). Το σύστημα "Star" βασίζεται στο τραπέζι. Ο πίνακας γεγονότων περιέχει μια στήλη όπου καθορίζεται η ποσότητα παράδοσης, καθώς και οι στήλες που υποδεικνύουν εξωτερικά πλήκτρα για όλους τους πίνακες μέτρησης. Κάθε μέτρηση του κύβου παρουσιάζεται με έναν πίνακα τιμών που αποτελεί αναφορά στο εργοστάσιο των γεγονότων. Για την οργάνωση των επιπέδων γενίκευης πληροφοριών σχετικά με τα βιβλία αναφοράς μέτρησης, οργανώνονται κατηγορηματικές εισροές (για παράδειγμα, "λεπτομέρεια υλικού", "προμηθευτής πόλης").

Ο λόγος για τον οποίο το σχήμα στο Σχ. 3.12 Ονομάζεται "Star" είναι προφανές. Τα άκρα των "αστεριών" σχηματίζονται από τους πίνακες μέτρησης και η σύνδεσή τους με τον πίνακα των γεγονότων που βρίσκονται στις ακτίνες του κέντρου. Με αυτή τη δομή της βάσης δεδομένων, τα περισσότερα αιτήματα από το πεδίο της επιχειρηματικής ανάλυσης συνδυάζουν τον κεντρικό πίνακα των γεγονότων με έναν ή περισσότερους πίνακες μέτρησης. Για παράδειγμα, ένα αίτημα για την απόκτηση όγκων παραδόσεων όλων των τμημάτων το 2004 κατά μήνα, με κατανομή από προμηθευτές, μοιάζει με αυτό:

Επιλέξτε άθροισμα (τιμή), προμηθευτής.Supplier_Name, fact.month_id

Από το γεγονός, προμηθευτής

Όπου convense.year_id \u003d 2004

Και γεγονός ..Supplier_Code \u003d προμηθευτής.Supplier_Code

GROUP_BY SOBJECT_CODE, MARGE_ID

Order_by προμηθευτής_Code, Month_ID.

Στο ΣΧ. 3.13 Εμφανίζεται ένα θραύσμα της έκθεσης που σχηματίζεται ως αποτέλεσμα συγκεκριμένης αίτησης.

Ορος Λειτουργική αναλυτική επεξεργασία(On-line αναλυτική επεξεργασία-Olap) αναφέρθηκε για πρώτη φορά στην έκθεση που προετοιμάστηκε για το Corp Software Arbor Το 1993, αν και ο ορισμός αυτού του όρου, όπως στην περίπτωση της αποθήκευσης δεδομένων, διατυπώθηκε πολύ αργότερα. Η έννοια που υποδεικνύεται από αυτόν τον όρο μπορεί να οριστεί ως μια "διαδραστική διαδικασία δημιουργίας, διατήρησης, ανάλυσης δεδομένων και έκδοσης εκθέσεων". Επιπλέον, συνήθως προσθέτουν ότι τα υπό εξέταση δεδομένα πρέπει να θεωρούνται και να υποβάλλονται σε επεξεργασία κατά τέτοιο τρόπο όπως εάν αποθηκεύτηκαν πολυδιάστατο πίνακα.Αλλά πριν προχωρήσετε στη συζήτηση μιας ίδιας της πολυδιάστατης παρουσίασης, εξετάστε τις κατάλληλες ιδέες όσον αφορά τα παραδοσιακά τραπέζια SQL.

Το πρώτο χαρακτηριστικό είναι ότι στην αναλυτική επεξεργασία απαιτεί σίγουρα κάποια συσσωμάτωση. δεδομένα,που συνήθως εκτελούνται αμέσως με λίγα Διαφορετικοί τρόποι ή, με άλλα λόγια, σύμφωνα με πολλά διαφορετικά κριτήρια ομαδοποίησης. Στην ουσία, ένα από τα κύρια προβλήματα της αναλυτικής επεξεργασίας είναι ότι ο αριθμός όλων των ειδών μεθόδων ομαδοποίησης είναι

Πολύ σύντομα γίνεται πολύ μεγάλο. Παρ 'όλα αυτά, οι χρήστες πρέπει να εξετάσουν όλους ή σχεδόν όλους τους τρόπους. Φυσικά, τώρα στο πρότυπο SQL, αυτή η συσσωμάτωση υποστηρίζεται, αλλά οποιοδήποτε συγκεκριμένο Αίτημα SQL αναπτύσσεται ως αποτέλεσμα μόνο ένα τραπέζι και όλες οι γραμμές σε αυτόν τον προκύπτον πίνακα έχουν την ίδια μορφή και την ίδια διερμηνεία10 (τουλάχιστον έτσι

9 Δίνουμε τις συμβουλές από το βιβλίο από τις αποθήκες δεδομένων: "[Αρνητική] από την κανονικοποίηση ... σε βασανιστήρια για την ομαλοποίηση οποιουδήποτε από τους πίνακες σε μια πολυδιάστατη βάση δεδομένων αποκλειστικά για την αποθήκευση του δίσκου δίσκου [ακριβώς έτσι!] - σε μια μάνα του χρόνου ... Οι πίνακες διάστασης δεν πρέπει να κανονικοποιηθούν ... Κανονικοποίηση Οι πίνακες διαστάσεων αποκλείουν την ικανότητα να βλέπουν ".

10 Εάν μόνο αυτό το πίνακα αποτελεσμάτων δεν περιλαμβάνει οποιεσδήποτε απροσδιόριστες τιμές, ή μηδενικές τιμές (βλέπε κεφάλαιο 19, ενότητα 19.3, υποτμήμα "για περισσότερες πληροφορίες σχετικά με τις προβλέψεις"). Στην πραγματικότητα, ο σχεδιασμός του SQL: 1999, ο οποίος θα πρέπει να περιγραφεί σε αυτό το τμήμα, μπορεί να ζητηθεί ως "με βάση τη χρήση" αυτού του πολύ δεν συνιστάται SQL (?). Σε δράση, υπογραμμίζουν το γεγονός ότι στις διάφορες εκδηλώσεις τους, οι αόριστες τιμές μπορεί να έχουν διαφορετικό νόημα και ως εκ τούτου σας επιτρέπουν να υποβάλλετε πολλές διαφορετικές πρόβλεψη των ράβδων σε έναν πίνακα (όπως θα εμφανίζεται παρακάτω).

Ήταν πριν από την εμφάνιση SQL: 1999). Έτσι ώστε να εφαρμόσει ΠΔιάφοροι τρόποι ομάδας, πρέπει να εκτελέσετε ΠΞεχωριστά ερωτήματα και δημιουργήστε ως αποτέλεσμα μεμονωμένων πινάκων. Για παράδειγμα, εξετάστε την ακόλουθη ακολουθία αιτημάτων που εκτελούνται στη βάση δεδομένων προμηθευτή και εξαρτημάτων.

1. Καθορίστε το συνολικό ποσό των παραδόσεων.

2. Καθορίστε τον συνολικό αριθμό των προμηθευτών στους προμηθευτές.

3. Καθορίστε λεπτομερώς το συνολικό ποσό των παραδόσεων.

4. Καθορίστε το συνολικό ποσό των παραδόσεων στους προμηθευτές και τις λεπτομέρειες.

(Σίγουρα, ο «συνολικός» αριθμός για αυτόν τον πάροχο και για το εν λόγω μέρος είναι απλώς ένα πραγματικό ποσό για αυτόν τον προμηθευτή και αυτό το μέρος. Ένα παράδειγμα θα ήταν πιο ρεαλιστικό εάν χρησιμοποιήθηκε η βάση βάσης δεδομένων, λεπτομέρειες και έργα. Αλλά για να μην περιπλέξει αυτό το παράδειγμα , εξακολουθούμε να σταματήσουμε τη συνήθη βάση των προμηθευτών και των λεπτομερειών.)

Τώρα υποθέστε ότι υπάρχουν μόνο δύο λεπτομέρειες, με τους αριθμούς P1 και P2 και ο πίνακας τροφοδοσίας έχει ως εξής.

Πολυδιάστατες βάσεις δεδομένων

Εξακολουθήμε να θεωρηθεί ότι τα δεδομένα OLAP αποθηκεύονται σε μια συμβατική βάση δεδομένων χρησιμοποιώντας τη γλώσσα SQL (χωρίς να υπολογίζουμε ότι μερικές φορές ασχολούμαστε ακόμα για την ορολογία και τις έννοιες Πολυδιάστατες βάσεις δεδομένων).Στην πραγματικότητα, εμείς, χωρίς να επισημαίνουμε σαφώς, περιέγραψε το λεγόμενο σύστημα Rolap.Σχετικός Olap-σχετικός Olap).Ωστόσο, πολλοί πιστεύουν ότι η χρήση του συστήματος Molap.(Πολυδιάστατο Olap.- πολυδιάστατο OLAP) - πιο ελπιδοφόρο μονοπάτι. Σε αυτό το εδάφιο, οι αρχές της κατασκευής συστημάτων Molap θα θεωρηθούν περισσότερο.

Το σύστημα Molap παρέχει συντήρηση πολυδιάστατες βάσεις δεδομένωνΣτην οποία τα δεδομένα αποθηκεύονται εννοιολογικά στα κύτταρα της πολυδιάστατης συστοιχίας.

Σημείωση. Αν και παραπάνω καιΟ. Σχετικός με την σύλληψη ή αντίληψηΗ μέθοδος οργάνωσης αποθήκευσης, στην πραγματικότητα, της φυσικής οργάνωσης των δεδομένων Molap.Πολύ παρόμοια με τη λογική τους οργάνωση.

Η υποστήριξη του DBMS καλείται πολυδιάστατο.Ως απλό παράδειγμα, μπορεί να δοθεί μια τρισδιάστατη συστοιχία που αντιπροσωπεύει, αντίστοιχα, αγαθά, πελάτες και χρονικές περιόδους. Η αξία κάθε μεμονωμένου κυττάρου μπορεί να αντιπροσωπεύει το συνολικό ποσό του συγκεκριμένου προϊόντος που πωλείται από τον πελάτη κατά την καθορισμένη χρονική περίοδο. Όπως σημειώθηκε παραπάνω, οι διασταυρούμενοι πίνακες από το προηγούμενο υποτμήμα μπορούν επίσης να θεωρηθούν τέτοιες συστοιχίες.

Εάν υπάρχει επαρκώς σαφής κατανόηση της δομής του συνόλου δεδομένων, όλοι οι σύνδεσμοι μεταξύ των δεδομένων μπορούν να είναι γνωστές. Εξάλλου, μεταβλητέςένα τέτοιο σύνολο (όχι με την έννοια των συμβατικών γλωσσών προγραμματισμού), κατά προσέγγιση, μπορεί να χωριστεί εξαρτώμενοςκαι Ανεξάρτητος. ΣΕΠροηγούμενο παράδειγμα Αγαθά, πελάτηςκαι χρονικό διάστημαμπορούν να θεωρηθούν ανεξάρτητες μεταβλητές, και ποσότητα -Τη μόνη εξαρτημένη μεταβλητή. Γενικά, οι ανεξάρτητες μεταβλητές είναι μεταβλητές των οποίων οι τιμές μαζί καθορίζουν τις τιμές των εξαρτημένων μεταβλητών (με τον ίδιο τρόπο όπως, εάν χρησιμοποιείτε σχεσιακή ορολογία, το πιθανό κλειδί είναι ένα σετ

Στήλες των οποίων οι τιμές καθορίζουν τις τιμές των υπόλοιπων στηλών). Ως εκ τούτου, οι ανεξάρτητες μεταβλητές έθεσαν τη διάσταση της συστοιχίας, με την οποία είναι οργανωμένα τα δεδομένα και επίσης τη μορφή Αντιμετώπιση του συστήματος11Για αυτή τη συστοιχία. Οι τιμές των εξαρτώμενων μεταβλητών που αντιπροσωπεύουν τα πραγματικά δεδομένα αποθηκεύονται στα κύτταρα του πίνακα.

Σημείωση. Διάκριση μεταξύ των αξιών ανεξάρτητων, ή διαστατικόςμεταβλητές

και τις τιμές των εξαρτημένων ή αδιευκρίνισμαοι μεταβλητές μερικές φορές χαρακτηρίζουν ως διαφορά μεταξύ Τοποθεσίακαι περιεχόμενο.

"Επομένως, τα κύτταρα συστοιχιών απευθύνονται συμβολικά και δεν χρησιμοποιούν αριθμητικούς δείκτες που χρησιμοποιούνται συνήθως για να λειτουργούν με συστοιχίες.

Δυστυχώς, το παραπάνω χαρακτηριστικό των πολυδιάστατων βάσεων δεδομένων είναι πολύ απλοποιημένη, δεδομένου ότι τα περισσότερα από τα σύνολα δεδομένων παραμένουν αρχικά δενμελετήθηκε πλήρως. Για το λόγο αυτό, συνήθως προσπαθούμε, πρώτα απ 'όλα, αναλύουμε τα δεδομένα προκειμένου να τα καταλάβετε καλύτερα. Συχνά μια ανεπαρκής κατανόηση μπορεί να είναι τόσο σημαντική ώστε να είναι αδύνατο να προσδιοριστεί εκ των προτέρων, οι μεταβλητές είναι ανεξάρτητες και οι οποίες εξαρτώνται. Στη συνέχεια, οι ανεξάρτητες μεταβλητές επιλέγονται σύμφωνα με την τρέχουσα αναπαράσταση τους (δηλ. Με βάση κάποια υπόθεση), μετά την οποία ελέγχεται η προκύπτουσα συστοιχία για να προσδιοριστεί πόσο καλά επιλέγονται οι ανεξάρτητες μεταβλητές (βλ. Ενότητα 22.7). Μια τέτοια προσέγγιση οδηγεί στο γεγονός ότι πολλές επαναλήψεις εκτελούνται στην αρχή των δειγμάτων και των σφαλμάτων. Ως εκ τούτου, το σύστημα επιτρέπει συνήθως την αντικατάσταση διαστασιολογικών και μη διαφορετικών μεταβλητών και αυτή η λειτουργία καλείται Άξονες μετατόπισης συντεταγμένων(Περιστροφή). Άλλες υποστηριζόμενες λειτουργίες περιλαμβάνουν Μεταφορά του Massivaκαι Αναδιάταξη διαστάσεων.Πρέπει επίσης να υπάρχει ένας τρόπος για να προσθέσετε διαστάσεις.

Με την ευκαιρία, από την προηγούμενη περιγραφή θα πρέπει να είναι σαφές ότι τα κύτταρα της συστοιχίας είναι συχνά κενά (και οι περισσότερες διαστάσεις, το πιο συχνά ένα τέτοιο φαινόμενο παρατηρείται). Με άλλα λόγια, οι συστοιχίες είναι συνήθως rewrked.Ας υποθέσουμε, για παράδειγμα, ότι το προϊόν R δεν πωλήθηκε στον πελάτη με όλη τη διάρκεια του χρόνου t.Στη συνέχεια, κύτταρο [C, P, T]Θα είναι άδειο (ή το καλύτερο να περιέχει μηδέν). Τα πολυδιάστατα DBMS υποστηρίζουν διάφορες μεθόδους αποθήκευσης των αραιωμένων συστοιχιών στην πιο αποτελεσματική, συμπιεσμένη αναπαράσταση12. Αυτό θα πρέπει να προσθέσει ότι τα κενά κύτταρα αντιστοιχούν σε ελλειπείς πληροφορίεςΚαι, ως εκ τούτου, τα συστήματα πρέπει να παρέχουν κάποια υποστήριξη υπολογιστών για κενά κύτταρα. Μια τέτοια υποστήριξη είναι πραγματικά συνήθως διαθέσιμη, αλλά, δυστυχώς, μοιάζει με ένα στυλ που υιοθετείται στο SQL. Δώστε προσοχή στο γεγονός ότι αν αυτό το κελί είναι κενό, τότε οι πληροφορίες είναι ή δεν είναι γνωστές ή δεν εισήχθησαν ή δεν ισχύουν ή δεν ισχύουν λόγω άλλων λόγων

(Βλ. Κεφάλαιο 19).

Οι ανεξάρτητες μεταβλητές συνδέονται συχνά ιεραρχίαΚαθορισμός διαδρομών στις οποίες μπορεί να συμβεί συσσωμάτωση εξαρτημένων δεδομένων. Για παράδειγμα, υπάρχει μια προσωρινή

Μια ιεραρχία που συνδέει τα δευτερόλεπτα με λεπτά, λεπτά με ένα ρολόι, ένα ρολόι με μια μέρα, μια μέρα με εβδομάδες, εβδομάδες με μήνες, μήνες με τα χρόνια. Ή ένα άλλο παράδειγμα: Η ιεραρχία είναι δυνατή

Συνθέσεις Σύνδεση εξαρτημάτων με ένα σύνολο εξαρτημάτων, σύνολα εξαρτημάτων με κόμβο, κόμβους με μονάδα, μονάδες με ένα προϊόν. Συχνά τα ίδια δεδομένα μπορούν να συγκεντρωθούν με πολλούς διαφορετικούς τρόπους, δηλ. Η ίδια ανεξάρτητη μεταβλητή μπορεί να ανήκει σε πολλές διαφορετικές ιεραρχίες. Το σύστημα παρέχει στους φορείς εκμετάλλευσης περνώ(Τρυπάνι) και πέρασμα(Τρυπάνι) για μια τέτοια ιεραρχία. Μπλουζασημαίνει μετακινώντας από το χαμηλότερο επίπεδο συσσωμάτωσης στην κορυφή, και Πέρασμα προς τα κάτω -

Μετάβαση στην αντίθετη κατεύθυνση. Για να συνεργαστείτε με ιεραρχίες, υπάρχουν και άλλες λειτουργίες, όπως μια επιχείρηση για την αναδιάταξη των επιπέδων της ιεραρχίας.

Σημείωση.Μεταξύ των εργασιών περνώ(Τρυπάνι) και Συσσώρευση έκβασης(Ρολό

up) υπάρχει μια λεπτή διαφορά: λειτουργία συσσώρευση των αποτελεσμάτων -Αυτή είναι μια λειτουργία λειτουργίας

12 Δώστε προσοχή σε αντίθεση με τα συστήματα σχεσιακών συστημάτων. Στο παρόν σχεσιακό ανάλογο αυτού του παραδείγματος στη συμβολοσειρά IC, P,t) Δεν θα υπήρχε κενή ποσότητα "κελί" λόγω του γεγονότος ότι η σειρά (s, r,t) το βάρος απλά θα λείπει. Επομένως, όταν χρησιμοποιείτε ένα σχεσιακό μοντέλο, σε αντίθεση με Πολυδιάστατες συστοιχίεςΔεν χρειάζεται να διατηρήσετε τις "σπάνια συστοιχίες", ή μάλλον "αραιά τραπέζια", πράγμα που σημαίνει ότι δεν απαιτούνται επιδέξια μέθοδοι συμπίεσης για να συνεργαστούν με τέτοιους πίνακες.

Απαιτούμενες μέθοδοι ομαδοποίησης και συσσωμάτωσης και λειτουργίας περνώΑυτή είναι μια λειτουργία ΠρόσβασηΣτα αποτελέσματα της εφαρμογής αυτών των μεθόδων. Και ένα παράδειγμα της επιχείρησης πέρασμαΥπάρχει ένα τέτοιο αίτημα: "Το τελικό ποσό των παραδόσεων είναι γνωστό, για να ληφθούν τα τελικά δεδομένα για κάθε επιμέρους προμηθευτή." Φυσικά, για την απάντηση σε αυτό το αίτημα θα πρέπει να είναι διαθέσιμα (ή υπολογιστικά) δεδομένα λεπτομερέστερων επιπέδων.

Ορισμένες στατιστικές και άλλες μαθηματικές λειτουργίες παρέχονται επίσης στα προϊόντα πολυδιάστατων βάσεων δεδομένων, τα οποία συμβάλλουν στη διαμόρφωση και τον έλεγχο των υποθέσεων (δηλαδή υποθέσεις που σχετίζονται με τους προτεινόμενους συνδέσμους). Επιπλέον, τα εργαλεία οπτικοποίησης και τα εργαλεία παραγωγής αναφοράς παρέχονται για την επίλυση τέτοιων εργασιών. Αλλά, δυστυχώς, δεν υπάρχει τυποποιημένη γλώσσα ερωτημάτων για πολυδιάστατες βάσεις δεδομένων, αν και η έρευνα βρίσκεται σε εξέλιξη για την ανάπτυξη υπολογισμού στην οποία θα μπορούσε να βασιστεί ένα τέτοιο πρότυπο. Αλλά τίποτα σαν τη σχεσιακή θεωρία της εξομάλυνσης, η οποία θα μπορούσε να χρησιμεύσει ως επιστημονική βάση για το σχεδιασμό πολυδιάστατων βάσεων δεδομένων, δυστυχώς, όχι.

Ολοκλήρωση αυτής της ενότητας, σημειώνουμε ότι ορισμένες προσεγγίσεις συνδυάζονται σε ορισμένα προϊόντα - Rolap και Molap. Τέτοιος olap υβριδικό σύστημαΚλήση Ίδιος.Οι ευρείες συζητήσεις διεξάγονται με στόχο την εξεύρεση ποια από τις τρεις αυτές προσεγγίσεις είναι καλύτερη, γι 'αυτό αξίζει να προσπαθήσουμε να πούμε λίγα λόγια σε αυτό το ζήτημα. Στη γενική περίπτωση, το σύστημα Molap παρέχει ταχύτερους υπολογισμούς, αλλά υποστηρίζει μικρότερους όγκους δεδομένων σε σύγκριση με τα συστήματα ROLAP, δηλ. Γίνεται λιγότερο αποτελεσματικό με τις αυξήσεις των δεδομένων. Και τα συστήματα Rolap παρέχουν πιο ανεπτυγμένη κλιμακωτή κλίμακα, παραλληλισμό και έλεγχο σε σύγκριση με παρόμοιες δυνατότητες των συστημάτων Molap. Επιπλέον, το πρότυπο SQL συμπληρώθηκε πρόσφατα και πολλές στατιστικές και αναλυτικές λειτουργίες συμπεριλήφθηκαν σε αυτό (βλ. Ενότητα 22.8). Από αυτό προκύπτει ότι σήμερα τα προϊόντα Rolap είναι ικανά να παρέχουν εκτεταμένες λειτουργίες.

Olap (online αναλυτική επεξεργασία - επιχειρησιακή αναλυτική επεξεργασία) είναι Διαδικασία πληροφόρησηςπου δίνει στον χρήστη να ζητήσει το σύστημα, την ανάλυση διεξαγωγής κλπ. Λειτουργική λειτουργία (σε απευθείας σύνδεση). Τα αποτελέσματα δημιουργούνται μέσα σε λίγα δευτερόλεπτα.

Τα συστήματα OLAP εκτελούνται για τελικούς χρήστες ενώ Συστήματα OLTP Για επαγγελματικούς χρήστες της IP. OLAP παρέχει τέτοιες ενέργειες ως παραγωγή ερωτημάτων, μη έγκυρες αναφορές, στατιστική ανάλυση και εφαρμογές πολυμέσων.

Για να εξασφαλίσετε την OLAP, είναι απαραίτητο να συνεργαστείτε με την αποθήκευση δεδομένων (ή πολυδιάστατη αποθήκευση), καθώς και με ένα σύνολο εργαλείων, συνήθως με πολυδιάστατες δυνατότητες. Αυτά τα κεφάλαια μπορούν να είναι εργαλεία εργαλείων, υπολογιστικά φύλλα, εργαλεία εξόρυξης δεδομένων, εργαλεία απεικόνισης δεδομένων κ.λπ.

Η βάση της έννοιας της OLAP βρίσκεται η αρχή της παρουσίασης πολυδιάστατων δεδομένων. Ο E. Codd εξέτασε τις ελλείψεις του σχεσιακού μοντέλου, πρώτα απ 'όλα, διευκρινίζοντας την αδυναμία συνδυασμού, προβολής και ανάλυσης δεδομένων από την άποψη της πολλαπλότητας των μετρήσεων, δηλαδή την πιο κατανοητή μέθοδο για τους εταιρικούς αναλυτές και έχει αποφασίσει Γενικές απαιτήσεις για συστήματα OLAP που επεκτείνουν τη λειτουργικότητα των σχεσιακών DBM και περιλαμβάνει πολυδιάστατη ανάλυση ως ένα από τα χαρακτηριστικά του.

12 Κανόνες που πρέπει να ικανοποιούν το OLAP της κατηγορίας προϊόντων λογισμικού. Αυτοί οι κανόνες:

1. Πολυδιάστατη εννοιολογική αναπαράσταση δεδομένων.

2. Διαφάνεια.

3. Προσβασιμότητα.

4. Βιώσιμη απόδοση.

5. Πελάτης - Αρχιτεκτονική διακομιστή.

6. Ισότητα μέτρησης.

7. Δυναμική επεξεργασία των σπανισμένων μήτρων.

8. Υποστήριξη για λειτουργία για πολλούς παίκτες.

9. Απεριόριστη υποστήριξη για διατομεακές επιχειρήσεις.

10. Διαισθητικό χειρισμό δεδομένων.

11. Ευέλικτο μηχανισμό παραγωγής αναφοράς.

12. Απεριόριστα επίπεδα μέτρησης και συσσωμάτωσης.

Το σύνολο αυτών των απαιτήσεων που χρησίμευαν ως τον πραγματικό ορισμό της OLAP θα πρέπει να θεωρηθούν ως συστατικό προϊόν και το συγκεκριμένο προϊόν αξιολογείται από τον βαθμό προσέγγισης για την απόλυτα πλήρη συμμόρφωση με όλες τις απαιτήσεις.


Ευφυής ανάλυση δεδομένων (εξόρυξη δεδομένων) και γνώση (εξόρυξη γνώσεων). Διαχείριση και ανάλυση μεγάλων ποσοτήτων δεδομένων (μεγάλα δεδομένα). Συστήματα επιχειρηματικών αναλυτικών στοιχείων (Business Intelligence, Bi).

Ευφυής ανάλυση δεδομένων (IAD) - κοινός όρος για την ανάλυση δεδομένων με την ενεργό χρήση Μαθηματικές μέθοδοι και αλγόριθμοι (μέθοδοι βελτιστοποίησης, γενετικοί αλγόριθμοι, αναγνώριση εικόνας, στατιστικές μέθοδοι, εξόρυξη δεδομένων κ.λπ.) χρησιμοποιώντας τα αποτελέσματα της χρήσης μεθόδων Οπτική παρουσίαση δεδομένα.



Στη γενική περίπτωση, η διαδικασία της Jiad αποτελείται από τρία στάδια:

1) Προσδιορισμός μοτίβων (δωρεάν αναζήτηση).

2) τη χρήση προσδιορισμένων μοτίβων για την πρόβλεψη άγνωστων τιμών (πρόβλεψη) ·

3) Ανάλυση εξαιρέσεων για τον εντοπισμό και την ερμηνεία των ανωμαλιών στις κανονικότητες που βρέθηκαν.

Μερικές φορές διακρίνει το ενδιάμεσο στάδιο της επαλήθευσης της αξιοπιστίας των κανονικότητας που βρέθηκαν (στάδιο επικύρωσης) μεταξύ της εύρεσης και χρήσης τους.

Όλες οι μέθοδοι της Jiad στην αρχή της εργασίας με τα δεδομένα προέλευσης χωρίζονται σε δύο ομάδες:

Οι μέθοδοι συλλογιστικής βάσει της ανάλυσης των προηγούμενων - τα αρχικά δεδομένα μπορούν να αποθηκευτούν σε μια σαφώς λεπτομερή μορφή και να χρησιμοποιούνται άμεσα για την πρόβλεψη και / ή την ανάλυση εξαιρέσεων. Το μειονέκτημα αυτής της ομάδας μεθόδων είναι η πολυπλοκότητα της χρήσης τους σε μεγάλες ποσότητες δεδομένων.

Μέθοδοι για την αναγνώριση και τη χρήση τυποποιημένων μοτίβων που απαιτούν πληροφορίες από τα πρωτογενή δεδομένα και το μετατρέπουν σε ορισμένες επίσημες δομές, ο τύπος του οποίου εξαρτάται από τη συγκεκριμένη μέθοδο.

Η εξόρυξη δεδομένων (DM) είναι μια τεχνολογία ανίχνευσης στα "ακατέργαστα" δεδομένα προηγουμένως άγνωστων μη ουσιαστικών, πρακτικά χρήσιμων και προσιτών ερμηνείας των απαραίτητων γνώσεων για τη λήψη αποφάσεων σε διάφορους τομείς ανθρώπινης δραστηριότητας. Οι αλγόριθμοι που χρησιμοποιούνται στην εξόρυξη δεδομένων απαιτούν μεγάλο αριθμό υπολογισμών, το οποίο ήταν προηγουμένως αποτρεπτικό αποτρεπτικό στην ευρεία πρακτική εφαρμογή αυτών των μεθόδων, αλλά η αύξηση της απόδοσης των σύγχρονων επεξεργαστών έλαβε την ευκρίνεια αυτού του προβλήματος.

Η αγορά επιχειρηματικών πληροφοριών αποτελείται από 5 τομείς:

1. προϊόντα OLAP;

2. Εργαλεία εξόρυξης δεδομένων.

3. Εργαλεία για αποθήκευση κτιρίων και προβολείς δεδομένων (αποθήκη δεδομένων);

4. Διαχείριση Πληροφοριακά συστήματα και εφαρμογές.

5. Εργαλεία τελικού χρήστη για εκτέλεση ερωτημάτων και αναφοράς.

Επί του παρόντος, μεταξύ των ηγετών των εταιρικών δικτυακών πλατφορμών, μπορείτε να επισημάνετε τη μικροδιδωτή, τα επιχειρηματικά αντικείμενα, την Cognos, τις λύσεις Hyperion, τη Microsoft, Oracle, το SAP, το Ινστιτούτο SAS και άλλους (στο προσάρτημα Β, μια συγκριτική ανάλυση μερικών Λειτουργικότητα Συστήματα BI).

Συνεχίζοντας το θέμα:
Λινάρι

Ο χρήστης στην ορολογία των προδιαγραφών) είναι ένα λογισμικό στο πλάι του συνδρομητή, το οποίο σας επιτρέπει να λαμβάνετε, να στείλετε, να δείτε και να επεξεργαστείτε ...

Νέα άρθρα
/
Δημοφιλής