Συστήματα εφαρμογής που βασίζονται στο πρότυπο των μεγάλων δεδομένων. Μεγάλες τάσεις της αγοράς. Πώς ισχύουν οι μεγάλες τεχνολογίες δεδομένων όπου προέρχονται

Η μόνιμη επιτάχυνση της ανάπτυξης των δεδομένων αποτελεί αναπόσπαστο στοιχείο της σύγχρονης πραγματικότητας. Κοινωνικά δίκτυα, κινητές συσκευές, δεδομένα από τις συσκευές μέτρησης, οι επιχειρηματικές πληροφορίες είναι μόνο λίγοι τύποι πηγών που μπορούν να δημιουργήσουν γιγαντιαίες συστοιχίες δεδομένων.

Επί του παρόντος ο όρος Μεγάλα δεδομένα. (Μεγάλα δεδομένα) έχουν γίνει αρκετά κοινό. Δεν έχει ακόμη συνειδητοποιήσει το πόσο γρήγορα και η βαθιά τεχνολογία για την επεξεργασία μεγάλων συστοιχιών δεδομένων αλλάζουν τις πιο διαφορετικές πτυχές της κοινωνίας. Οι αλλαγές εμφανίζονται σε διάφορες σφαίρες, δημιουργώντας νέα προβλήματα και προκλήσεις, μεταξύ άλλων στον τομέα της ασφάλειας των πληροφοριών, όπου θα πρέπει να υπάρχουν τέτοιες βασικές πτυχές όπως εμπιστευτικότητα, ακεραιότητα, διαθεσιμότητα κ.λπ.

Δυστυχώς, πολλές σύγχρονες εταιρείες προσφέρονται σε μεγάλη τεχνολογία δεδομένων χωρίς να δημιουργούν μια σωστή υποδομή που θα μπορούσαν να εξασφαλίσουν αξιόπιστη αποθήκευση τεράστιων συστοιχιών δεδομένων που συλλέγουν και αποθηκεύουν. Από την άλλη πλευρά, μια τεχνολογία blockchain αναπτύσσεται γρήγορα γρήγορα, η οποία έχει σχεδιαστεί για να λύσει αυτό και πολλά άλλα προβλήματα.

Ποια είναι τα μεγάλα δεδομένα;

Στην ουσία, ο ορισμός του όρου βρίσκεται στην επιφάνεια: "μεγάλα δεδομένα" νοούνται τη διαχείριση πολύ μεγάλων ποσοτήτων δεδομένων, καθώς και την ανάλυσή τους. Εάν είναι ευρύτερη, τότε αυτή είναι η πληροφόρηση που δεν μπορούν να υποβληθούν σε επεξεργασία από κλασικές μεθόδους λόγω των μεγάλων όγκων του.

Ο όρος τα ίδια τα μεγάλα δεδομένα εμφανίστηκαν σχετικά πρόσφατα. Σύμφωνα με την υπηρεσία Trends Google, η ενεργός αύξηση της δημοτικότητας του όρου πέφτει στο τέλος του 2011:

Το 2010 εμφανίστηκαν τα πρώτα προϊόντα και λύσεις που σχετίζονται άμεσα με την επεξεργασία μεγάλων δεδομένων. Μέχρι το 2011, οι περισσότερες από τις μεγαλύτερες εταιρείες πληροφορικής, συμπεριλαμβανομένου του IBM, της Oracle, της Microsoft και της Hewlett-Packard, χρησιμοποιούν ενεργά τον όρο μεγάλα δεδομένα στις επιχειρηματικές τους στρατηγικές. Σταδιακά, οι αναλυτές της αγοράς πληροφορικής αρχίζουν ενεργές μελέτες αυτής της έννοιας.

Επί του παρόντος, ο όρος αυτός έχει αποκτήσει σημαντική δημοτικότητα και χρησιμοποιείται ενεργά σε μια μεγάλη ποικιλία σφαίρων. Ωστόσο, είναι αδύνατο να πούμε με την εμπιστοσύνη ότι τα μεγάλα δεδομένα είναι ένα είδος θεμελιωδώς νέου φαινομένου - αντίθετα, υπάρχουν μεγάλες πηγές δεδομένων για πολλά χρόνια. Στο μάρκετινγκ, μπορούν να καλέσουν τις βάσεις δεδομένων για τις αγορές πελατών, τις πιστωτικές ιστορίες, τον τρόπο ζωής, τον τρόπο ζωής κλπ. Με την πάροδο των ετών, οι αναλυτές χρησιμοποίησαν αυτά τα δεδομένα για να βοηθήσουν στην πρόβλεψη των μελλοντικών αναγκών των πελατών, να αξιολογήσουν τους κινδύνους, να σχηματίσουν τις προτιμήσεις των καταναλωτών κλπ.

Επί του παρόντος, η κατάσταση έχει αλλάξει σε δύο πτυχές:

- εμφανίστηκαν πιο σύνθετα εργαλεία και μεθόδους ανάλυσης και σύγκρισης Διαφορετικά σύνολα δεδομένα;
- Τα εργαλεία ανάλυσης συμπληρώθηκαν με πολλές νέες πηγές δεδομένων, η οποία οφείλεται στην ευρέως διαδεδομένη μετάβαση στις ψηφιακές τεχνολογίες, καθώς και νέες μεθόδους συλλογής δεδομένων και μέτρησης δεδομένων.

Οι ερευνητές προβλέπουν ότι οι μεγάλες τεχνολογίες δεδομένων θα είναι πιο δραστήριες στην παραγωγή, την υγεία, το εμπόριο, τη δημόσια διοίκηση και σε άλλους διάφορους τομείς και βιομηχανίες.

Τα μεγάλα δεδομένα δεν είναι μια συγκεκριμένη συστοιχία δεδομένων, αλλά ένα σύνολο μεθόδων επεξεργασίας τους. Το αποφασιστικό χαρακτηριστικό για τα μεγάλα δεδομένα δεν είναι μόνο ο όγκος τους, αλλά και άλλες κατηγορίες που χαρακτηρίζουν τις χρονοβόρες διαδικασίες επεξεργασίας και ανάλυσης δεδομένων.

Ως δεδομένα πηγής για επεξεργασία, για παράδειγμα:

- Σύνδεση της συμπεριφοράς των χρηστών του Διαδικτύου.
- Το διαδίκτυο των πραγμάτων;
- μεσα ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ;
- Μετεωρολογικά δεδομένα.
- Ψηφιοποιημένα βιβλία των μεγαλύτερων βιβλιοθηκών.
- σήματα GPS από οχήματα ·
- πληροφορίες σχετικά με τις συναλλαγές των πελατών των τραπεζών ·
- δεδομένα σχετικά με τη θέση των συνδρομητών του κινητού δικτύου ·
- πληροφορίες σχετικά με τις αγορές σε μεγάλα λιανικά δίκτυα κλπ.

Με την πάροδο του χρόνου, το ποσό των δεδομένων και ο αριθμός των πηγών τους αυξάνεται συνεχώς, και σε αυτό το πλαίσιο εμφανίζονται νέες και ήδη υπάρχουσες μέθοδοι επεξεργασίας πληροφοριών.

Βασικές αρχές μεγάλα δεδομένα:

- Οριζόντια κλιμονή - οι συστοιχίες δεδομένων μπορεί να είναι τεράστιες και αυτό σημαίνει ότι το σύστημα επεξεργασίας μεγάλων δεδομένων θα πρέπει να επεκταθεί δυναμικά με αύξηση των όγκων τους.
- Ανοχή κλάσης - Ακόμη και με την αποτυχία ορισμένων στοιχείων εξοπλισμού, ολόκληρο το σύστημα πρέπει να παραμείνει λειτουργικό.
- Τοποθεσία δεδομένων. Σε μεγάλα κατανεμημένα συστήματα, τα δεδομένα συνήθως διανέμονται σε σημαντικό αριθμό μηχανών. Ωστόσο, στο μέτρο του δυνατού και προκειμένου να εξοικονομηθούν πόροι, τα δεδομένα συχνά επεξεργάζονται στον ίδιο διακομιστή όπως αποθηκεύονται.

Για τη σταθερή λειτουργία και οι τρεις αρχές και, κατά συνέπεια, η υψηλή απόδοση αποθήκευσης και η επεξεργασία μεγάλων δεδομένων απαιτεί νέες τεχνολογίες σημαντικών, όπως, για παράδειγμα, blockchain.

Γιατί χρειάζεστε μεγάλα δεδομένα;

Το πεδίο των μεγάλων δεδομένων επεκτείνεται συνεχώς:

- Τα μεγάλα δεδομένα μπορούν να χρησιμοποιηθούν στην ιατρική. Έτσι, είναι δυνατόν να προσδιοριστεί η διάγνωση του ασθενούς όχι μόνο να βασίζεται στην ανάλυση του ιστορικού της νόσου, αλλά και λαμβάνοντας υπόψη την εμπειρία άλλων ιατρών, πληροφορίες σχετικά με την οικολογική κατάσταση της περιοχής του ασθενούς και πολλούς άλλους παράγοντες.
- Οι μεγάλες τεχνολογίες δεδομένων μπορούν να χρησιμοποιηθούν για την οργάνωση της κίνησης των μη επανδρωμένων οχημάτων.
- Επεξεργασία μεγάλων συστοιχιών δεδομένων μπορεί να αναγνωριστεί από πρόσωπα σε υλικά φωτογραφιών και βίντεο.
- Οι μεγάλες τεχνολογίες δεδομένων μπορούν να χρησιμοποιηθούν από τους λιανοπωλητές - οι εμπορικές εταιρείες μπορούν να χρησιμοποιήσουν ενεργά συστοιχίες δεδομένων από κοινωνικά δίκτυα για να διαμορφώσουν αποτελεσματικά τις διαφημιστικές τους καμπάνιες που μπορούν να προσανατολισθούν σε ένα συγκεκριμένο τμήμα καταναλωτή.
Αυτή η τεχνολογία Χρησιμοποιείται ενεργά στην οργάνωση των εκλογών προεκλογικών, συμπεριλαμβανομένης της ανάλυσης των πολιτικών προτιμήσεων στην κοινωνία.
- Η χρήση μεγάλων τεχνολογιών δεδομένων είναι σημαντική για τις αποφάσεις της κλάσης Εγγυήσεων του Εισαθέματος (RA), οι οποίες περιλαμβάνουν τα εργαλεία ανίχνευσης ασυνέπειων και την ανάλυση σε βάθος δεδομένων, επιτρέποντας τον εντοπισμό των πιθανών απωλειών εγκαίρως ή να στρεβλώνει τις πληροφορίες που μπορούν να οδηγήσουν σε μείωση των οικονομικών αποτελεσμάτων.
- οι πάροχοι τηλεπικοινωνιών μπορούν να συγκεντρωθούν μεγάλα δεδομένα, συμπεριλαμβανομένων των γεωγραφικών στοιχείων · Με τη σειρά τους, αυτές οι πληροφορίες ενδέχεται να είναι εμπορικά ενδιαφέροντα για διαφημιστικά γραφεία που μπορούν να το χρησιμοποιήσουν για να δείξουν στοχευμένες και τοπικές διαφημίσεις, καθώς και για τους λιανοπωλητές και τις τράπεζες.
- Τα μεγάλα δεδομένα μπορούν να διαδραματίσουν σημαντικό ρόλο στην επίλυση του ανοίγματος ενός σημείου διαπραγμάτευσης σε μια συγκεκριμένη τοποθεσία που βασίζεται σε δεδομένα σχετικά με την παρουσία μιας ισχυρής ροής στόχων ανθρώπων.

Έτσι, η πιο προφανής πρακτική εφαρμογή της μεγάλης τεχνολογίας δεδομένων βρίσκεται στο μάρκετινγκ. Χάρη στην ανάπτυξη του Διαδικτύου και διανέμουν όλα τα είδη των συσκευών επικοινωνίας, τα δεδομένα συμπεριφοράς (όπως ο αριθμός των κλήσεων, των αγορών και οι αγορές), διατίθενται σε πραγματικό χρόνο.

Η μεγάλη τεχνολογία δεδομένων μπορεί επίσης να χρησιμοποιηθεί αποτελεσματικά στη χρηματοδότηση, για κοινωνιολογικές μελέτες και σε πολλές άλλες περιοχές. Οι ειδικοί υποστηρίζουν ότι όλες αυτές οι δυνατότητες χρήσης μεγάλων δεδομένων είναι μόνο ένα ορατό μέρος του παγόβουνου, δεδομένου ότι σε πολύ μεγαλύτερους τόμους, αυτές οι τεχνολογίες χρησιμοποιούνται σε νοημοσύνη και αντιπαραγωγεί, σε μια στρατιωτική επιχείρηση, καθώς και σε όλα όσα είναι συνηθισμένοι να καλέσουν πολέμους πληροφόρησης .

Σε γενικές γραμμές, η ακολουθία της εργασίας με τα μεγάλα δεδομένα συνίσταται στη συλλογή δεδομένων, η διάρθρωση έλαβε πληροφορίες χρησιμοποιώντας εκθέσεις και πίνακες ελέγχου, καθώς και η επακόλουθη διατύπωση συστάσεων σε δράση.

Σκεφτείτε σύντομα τη χρήση μεγάλων τεχνολογιών δεδομένων στο μάρκετινγκ. Όπως γνωρίζετε, για τις πληροφορίες του εμπορίου είναι το κύριο εργαλείο για την πρόβλεψη και την κατάρτιση μιας στρατηγικής. Η ανάλυση μεγάλων δεδομένων έχει μακρά και επιτυχώς εφαρμοστεί με επιτυχία για να καθορίσει το κοινό-στόχο, τα συμφέροντα, τη ζήτηση και τη δραστηριότητα των καταναλωτών. Ανάλυση μεγάλων δεδομένων, ειδικότερα, σας επιτρέπει να εξάγετε μια διαφήμιση (με βάση το μοντέλο δημοπρασίας RTB - Προσφορά σε πραγματικό χρόνο) μόνο στους καταναλωτές που ενδιαφέρονται για το προϊόν ή την υπηρεσία.

Η χρήση μεγάλων δεδομένων στο μάρκετινγκ επιτρέπει στους επιχειρηματίες:

- Είναι καλύτερο να αναγνωρίζετε τους καταναλωτές σας, να προσελκύσετε ένα παρόμοιο κοινό στο Διαδίκτυο.
- αξιολόγηση του βαθμού ικανοποίησης του πελάτη ·
- να κατανοήσουμε εάν η προτεινόμενη υπηρεσία πληροί τις προσδοκίες και τις ανάγκες ·
- να βρουν και να εφαρμόσουν νέους τρόπους που αυξάνουν την εμπιστοσύνη των πελατών.
- Δημιουργία έργων που χρησιμοποιούν ζήτηση κλπ.

Για παράδειγμα, η υπηρεσία Google.Trends ενδέχεται να υποδεικνύει την πρόβλεψη του εμπορίου για εποχιακή ζήτηση για ένα συγκεκριμένο προϊόν, διακυμάνσεις και γεωγραφία των κλικ. Εάν συγκρίνετε αυτές τις πληροφορίες με στατιστικά στοιχεία που συλλέγονται από το αντίστοιχο plugin στον δικό σας ιστότοπο, μπορείτε να δημιουργήσετε ένα σχέδιο για τη διανομή του προϋπολογισμού διαφήμισης, υποδεικνύοντας τον μήνα, την περιοχή και άλλες παραμέτρους.

Σύμφωνα με πολλούς ερευνητές, είναι σε κατακερματισμό και τη χρήση μεγάλων δεδομένων που ολοκληρώνεται η επιτυχία της εκστρατείας της Prampa. Η ομάδα του μέλλοντος του Προέδρου των ΗΠΑ μπόρεσε να διαιρέσει σωστά το κοινό, να κατανοήσει τις επιθυμίες της και να δείξει ακριβώς ότι ο αγγελιοφόρος που οι ψηφοφόροι θέλουν να δουν και να ακούσουν. Έτσι, σύμφωνα με την Irina Beljheva από τη συμμαχία δεδομένων, η νίκη του Trump έγινε πολλές φορές χάρη σε μια μη τυποποιημένη προσέγγιση στο μάρκετινγκ Διαδικτύου, το οποίο βασίστηκε σε μεγάλα δεδομένα, ψυχολογική ανάλυση συμπεριφοράς και εξατομικευμένη διαφήμιση.

Οι πολιτικές τεχνολογίες και οι έμποροι του τραμ χρησιμοποίησαν ένα ειδικά αναπτυγμένο μαθηματικό μοντέλο, το οποίο μας επέτρεψε να αναλύσουμε βαθιά τα δεδομένα όλων των ΗΠΑ ψηφοφόρων για τη συστηματοποίησή τους κάνοντας τη στόχευση υπερ-ροών όχι μόνο από γεωγραφικά σημεία, αλλά και από τις προθέσεις, τα συμφέροντα των ψηφοφόρων, Ψυχωτικά, συμπεριφορικά χαρακτηριστικά κ.λπ. Αφού οι έμποροι αυτοί οι έμποροι οργανώθηκαν εξατομικευμένη επικοινωνία με καθεμία από τις ομάδες πολιτών με βάση τις ανάγκες, τις διαθέσεις, τις πολιτικές απόψεις, τα ψυχολογικά χαρακτηριστικά τους, ακόμη και τα χρώματα του δέρματος χρησιμοποιώντας σχεδόν κάθε μεμονωμένο ψηφοφόρο από την αποστολή τους.

Όσον αφορά τη Χίλαρι Κλίντον, στη συνέχεια στην εκστρατεία του που χρησιμοποίησε μεθόδους "Αποδεδειγμένη ώρα" με βάση τα κοινωνιολογικά δεδομένα και το Standard Marketing, διαιρώντας το εκλογικό σώμα μόνο σε τυπικά ομοιογενείς ομάδες (άνδρες, γυναίκες, αφρικανούς Αμερικανούς, Λατινικούς Αμερικανούς, φτωχούς, πλούσιους κ.λπ.).

Ως αποτέλεσμα, κέρδισε αυτόν που εκτιμά τις δυνατότητες νέων τεχνολογιών και μεθόδων ανάλυσης. Αξίζει να σημειωθεί ότι το κόστος της εκλογικής εκστρατείας Χίλαρι Κλίντον ήταν διπλάσιο από τον αντίπαλό της:

Δεδομένα: Έρευνα PEW

Μεγάλα προβλήματα χρήσης μεγάλων δεδομένων

Εκτός από το υψηλό κόστος, ένας από τους κύριους παράγοντες που αναστέλλουν την εισαγωγή μεγάλων δεδομένων σε διάφορες σφαίρες είναι το πρόβλημα της επεξεργασίας δεδομένων: δηλαδή, οι ορισμοί των οποίων τα δεδομένα πρέπει να αφαιρεθούν, να αποθηκεύονται και να αναλυθούν και τα οποία δεν είναι λαμβάνονται υπόψη.

Ένα άλλο πρόβλημα τα μεγάλα δεδομένα είναι ηθική. Με άλλα λόγια, προκύπτει φυσική ερώτηση: Μπορεί αυτή η συλλογή δεδομένων (ειδικά χωρίς τη γνώση του χρήστη) να θεωρηθεί παραβίαση των ιδιωτικών συνόρων;

Δεν είναι μυστικό ότι οι πληροφορίες που αποθηκεύονται Μηχανές αναζήτησης Το Google και το Yandex, το επιτρέπει στους γίγαντες να βελτιώσουν συνεχώς τις υπηρεσίες τους, να τις βολεύσουν για χρήστες και να δημιουργήσουν νέες διαδραστικές εφαρμογές. Για να το κάνετε αυτό, οι μηχανές αναζήτησης συλλέγουν δεδομένα χρήστη στη δραστηριότητα του Διαδικτύου στο Διαδίκτυο, οι διευθύνσεις IP, τα δεδομένα γεωργίας, τα προσωπικά δεδομένα, τα προσωπικά δεδομένα, τα προσωπικά δεδομένα, Ταχυδρομικά μηνύματα Και οι δύο. Όλα αυτά σας επιτρέπουν να αποδείξετε τη διαφήμιση συμφραζομένων σύμφωνα με τη συμπεριφορά του χρήστη στο Διαδίκτυο. Στην περίπτωση αυτή, συνήθως η συγκατάθεση των χρηστών δεν το ζητά αυτό και η δυνατότητα επιλογής που δεν παρέχονται πληροφορίες για τον εαυτό τους. Δηλαδή, από προεπιλογή, τα μεγάλα δεδομένα θα πάνε σε όλα όσα θα αποθηκευτούν στη συνέχεια στους διακομιστές δεδομένων του χώρου.

Αυτό συνεπάγεται το ακόλουθο σημαντικό πρόβλημα σχετικά με την ασφάλεια της αποθήκευσης και χρήσης δεδομένων. Για παράδειγμα, υπάρχει μια ασφαλής αναλυτική πλατφόρμα που οι καταναλωτές στο Αυτόματη λειτουργία Μεταφέρετε τα δεδομένα σας; Επιπλέον, πολλοί εκπρόσωποι των επιχειρήσεων σημειώνουν μια έλλειψη αναλυτών υψηλής ειδίκευσης και εμπόρων που μπορούν να λειτουργούν αποτελεσματικά σε μεγάλες ποσότητες δεδομένων και να λύσουν συγκεκριμένα επιχειρηματικά καθήκοντα με τη βοήθειά τους.

Παρά τις δυσκολίες με την εισαγωγή μεγάλων δεδομένων, η επιχείρηση προτίθεται να αυξήσει την επένδυση προς αυτή την κατεύθυνση. Σύμφωνα με την έρευνα του Gartner, οι ηγέτες της επένδυσης σε μεγάλες βιομηχανίες δεδομένων είναι μέσα ενημέρωσης, λιανικής, τηλεπικοινωνιακοί, τραπεζικοί τομείς και εταιρείες υπηρεσιών.

Προοπτικές για την αλληλεπίδραση των τεχνολογιών Blockchain και των μεγάλων δεδομένων

Η ενσωμάτωση με μεγάλα δεδομένα φέρει ένα συνεργιστικό αποτέλεσμα και ανοίγει ένα ευρύ φάσμα νέων χαρακτηριστικών, συμπεριλαμβανομένων των εξής:

- να αποκτήσετε πρόσβαση σε λεπτομερείς πληροφορίες σχετικά με τις προτιμήσεις των καταναλωτών, βάσει των οποίων μπορείτε να δημιουργήσετε λεπτομερή αναλυτικά προφίλ για συγκεκριμένους προμηθευτές, προϊόντα και εξαρτήματα προϊόντων.
- ενσωμάτωση λεπτομερών στοιχείων σχετικά με τις συναλλαγές και στατιστικά στοιχεία της κατανάλωσης ορισμένων ομάδων εμπορευμάτων από διάφορες κατηγορίες χρηστών ·
- λαμβάνουν λεπτομερή αναλυτικά στοιχεία σχετικά με τις αλυσίδες εφοδιασμού και κατανάλωσης, ελέγχουν την απώλεια προϊόντων κατά τη μεταφορά (για παράδειγμα, απώλεια βάρους λόγω ξήρανσης και εξάτμισης ορισμένων τύπων εμπορευμάτων) ·
- να εξουδετερώσει τις παραποιήσεις των προϊόντων, αυξήστε την αποτελεσματικότητα της καταπολέμησης της νομιμοποίησης εσόδων από παράνομες δραστηριότητες και την απάτη κ.λπ.

Η πρόσβαση στα λεπτομερή στοιχεία σχετικά με τη χρήση και την κατανάλωση αγαθών θα αποκαλύψει σε μεγάλο βαθμό το δυναμικό της μεγάλης τεχνολογίας δεδομένων για τη βελτιστοποίηση των βασικών επιχειρηματικών διαδικασιών, η μείωση των ρυθμιστικών κινδύνων, θα αποκαλύψει νέες ευκαιρίες για τη δημιουργία δημόσιων και δημιουργίας προϊόντων, η οποία θα μεγιστοποιήσει τις σχετικές προτιμήσεις των καταναλωτών.

Όπως είναι γνωστό, εκπρόσωποι των μεγαλύτερων χρηματοπιστωτικών ιδρυμάτων, συμπεριλαμβανομένων κ.λπ., κατά τη γνώμη του Oliver Bussmann, του Swiss Financial Holding UBS, η IT-Manager της ελβετικής χρηματοοικονομικής εκμετάλλευσης, η αποκλειστική τεχνολογία είναι σε θέση να "μειώσει τη συναλλαγή Χρόνος επεξεργασίας από αρκετές ημέρες έως μερικά λεπτά ".

Το δυναμικό ανάλυσης από το blockchain με τη βοήθεια της μεγάλης τεχνολογίας δεδομένων είναι τεράστιο. Η τεχνολογία κατανεμημένων μητρώου εξασφαλίζει την ακεραιότητα των πληροφοριών, καθώς και την αξιόπιστη και διαφανή αποθήκευση ολόκληρου του ιστορικού της συναλλαγής. Τα μεγάλα δεδομένα, με τη σειρά τους, παρέχουν νέα εργαλεία για την αποτελεσματική ανάλυση, πρόβλεψη, οικονομική μοντελοποίηση και, κατά συνέπεια, ανοίγει νέες ευκαιρίες για να αποτιμήσουμε πιο ανασταλτικές αποφάσεις διαχείρισης.

Tandem Blockchain και μεγάλα δεδομένα μπορούν να χρησιμοποιηθούν με επιτυχία στην υγειονομική περίθαλψη. Όπως γνωρίζετε, τα ατελή και ελλιπή δεδομένα σχετικά με την υγεία του ασθενούς κατά καιρούς αυξάνουν τον κίνδυνο διαμόρφωσης εσφαλμένης διάγνωσης και εσφαλμένη συνταγογραφούμενη θεραπεία. Κριτικά σημαντικά δεδομένα σχετικά με την υγεία των πελατών των ιατρικών ιδρυμάτων πρέπει να προστατεύονται, να έχουν τη δυνατότητα να ελεγχθούν οι ιδιότητες της αμερικανότητας, να ελεγχθούν και δεν πρέπει να υπόκεινται σε καμιά χειρισμούς.

Οι πληροφορίες στο blockchalter πληροί όλες τις απαιτήσεις που αναφέρονται και μπορούν να χρησιμεύσουν ως υψηλής ποιότητας και αξιόπιστα δεδομένα πηγής για τη βαθιά ανάλυση χρησιμοποιώντας νέες μεγάλες τεχνολογίες δεδομένων. Επιπλέον, με τη βοήθεια του blockchain, τα ιατρικά ιδρύματα θα είναι σε θέση να ανταλλάσσουν αξιόπιστα δεδομένα με ασφαλιστικές εταιρείες, δικαιοσύνη, φορείς, εργοδότες, επιστημονικά ιδρύματα και άλλους οργανισμούς που χρειάζονται ιατρικές πληροφορίες.

Μεγάλη ασφάλεια δεδομένων και πληροφοριών

Με μεγάλη έννοια, η ασφάλεια των πληροφοριών είναι η ασφάλεια των πληροφοριών και η υποστήριξη των υποδομών από τυχαίες ή σκόπιμες αρνητικές επιπτώσεις φυσικού ή τεχνητού χαρακτήρα.

Στον τομέα της ασφάλειας των πληροφοριών, τα μεγάλα δεδομένα αντιμετωπίζουν τις ακόλουθες προκλήσεις:

- Προβλήματα προστασίας των δεδομένων και εξασφαλίζουν την ακεραιότητά τους.
- τον κίνδυνο των ξένων και διαρροών εμπιστευτικών πληροφοριών ·
- ακατάλληλη αποθήκευση εμπιστευτικών πληροφοριών ·
- τον κίνδυνο απώλειας πληροφοριών, για παράδειγμα, ως αποτέλεσμα κάποιων κακόβουλων ενεργειών ·
- τον κίνδυνο κατάχρησης προσωπικών δεδομένων από τρίτους κ.λπ.

Ένα από τα κύρια προβλήματα μεγάλων δεδομένων που το blockchain προορίζεται να λύσει είναι στον τομέα της ασφάλειας των πληροφοριών. Με τη συμμόρφωση με όλες τις βασικές αρχές, η τεχνολογία κατανεμημένων μητρώου μπορεί να εγγυηθεί την ακεραιότητα και την ακρίβεια των δεδομένων και χάρη στην απουσία ενός μόνο σημείου άρνησης, το blockchain καθιστά σταθερή λειτουργία των συστημάτων πληροφοριών. Η τεχνολογία κατανεμημένων μητρώου μπορεί να συμβάλει στην επίλυση του προβλήματος της εμπιστοσύνης στα δεδομένα, καθώς και να παρέχει τη δυνατότητα καθολικής ανταλλαγής τους.

Οι πληροφορίες αποτελούν ένα πολύτιμο περιουσιακό στοιχείο, πράγμα που σημαίνει ότι στο προσκήνιο θα πρέπει να είναι το ζήτημα της εξασφάλισης των κύριων πτυχών της ασφάλειας των πληροφοριών. Για να σταθεί σε έναν ανταγωνιστικό αγώνα, οι εταιρείες θα πρέπει να συμβαδίζουν με τους χρόνους, πράγμα που σημαίνει ότι δεν μπορούν να αγνοηθούν από τις πιθανές ευκαιρίες και τα οφέλη που εισέρχονται στον εαυτό τους η τεχνολογία blockchain και τα μεγάλα εργαλεία δεδομένων.

Μεγάλα δεδομένα (ή μεγάλα δεδομένα) είναι ένα σύνολο μεθόδων εργασίας με τεράστιους όγκους δομημένων ή αδόμητων πληροφοριών. Οι ειδικοί στην εργασία με μεγάλα δεδομένα ασχολούνται με την επεξεργασία και την ανάλυση τους για να αποκτήσουν οπτικά, αντιληπτημένα αποτελέσματα. Με κοιτάξτε μίλησε με επαγγελματίες και ανακάλυψε ποια είναι η κατάσταση με την επεξεργασία μεγάλων δεδομένων στη Ρωσία, πού και τι είναι καλύτερο να μάθουμε σε εκείνους που θέλουν να εργαστούν σε αυτόν τον τομέα.

Alexey Rupin στις κύριες κατευθύνσεις στον τομέα των μεγάλων δεδομένων, επικοινωνίας με τους πελάτες και τον κόσμο των αριθμών

Σπούδασα στο Ινστιτούτο Ηλεκτρονικής Τεχνολογίας της Μόσχας. Το κύριο πράγμα που κατάφερα να βγάλω, είναι θεμελιώδεις γνώσεις της φυσικής και των μαθηματικών. Ταυτόχρονα, εργάστηκα στο κέντρο Ε & Α, όπου ασχολήθηκε με την ανάπτυξη και την εφαρμογή θυρωθμών ευφορίας κωδικοποίησης για τα μέσα προστατευόμενης μεταφοράς δεδομένων. Μετά το τέλος του προπτυχιακού καταλόγου, εισήλθα στον δικαστή της επιχειρηματικής πληροφορικής της Ανώτατης Σχολής Οικονομικών. Μετά από αυτό, ήθελα να εργαστώ στο IBS. Ήμουν τυχερός ότι εκείνη την εποχή υπήρχε ένα πρόσθετο σύνολο ασκούμενων σε σχέση με ένα μεγάλο αριθμό έργων και μετά από αρκετές συνεντεύξεις άρχισα να δουλεύω στο IBS, μία από τις μεγαλύτερες ρωσικές εταιρείες στον τομέα αυτό. Για τρία χρόνια, πήγα μακριά από το τρένο πριν από τον αρχιτέκτονα εταιρικών λύσεων. Τώρα ασχολούμαι με την ανάπτυξη μεγάλων τεχνολογιών δεδομένων για εταιρείες πελατών από τον οικονομικό και τηλεπικοινωνιακό τομέα.

Υπάρχουν δύο βασικές ειδικότητες για άτομα που θέλουν να συνεργαστούν με μεγάλα δεδομένα: αναλυτές και συμβούλους πληροφορικής που δημιουργούν τεχνολογίες για την εργασία με μεγάλα δεδομένα. Επιπλέον, μπορείτε επίσης να μιλήσετε για το επάγγελμα του μεγάλου αναλυτή δεδομένων, δηλ., Οι άνθρωποι που εργάζονται άμεσα με τα δεδομένα με την πλατφόρμα πληροφορικής από τον πελάτη. Προηγουμένως, ήταν οι συνήθεις αναλυτές των μαθηματικών που γνώριζαν τα στατιστικά στοιχεία και τα μαθηματικά και χρησιμοποιώντας το στατιστικό λογισμικό για την επίλυση των εργασιών ανάλυσης δεδομένων. Σήμερα, εκτός από τη γνώση των στατιστικών και των μαθηματικών, η κατανόηση της τεχνολογίας και ενός κύκλου ζωής των δεδομένων είναι επίσης απαραίτητη. Σε αυτό, κατά τη γνώμη μου, είναι η διαφορά μεταξύ του σύγχρονου αναλυτή δεδομένων από εκείνους τους αναλυτές που ήταν πριν.

Η εξειδίκευσή μου είναι η διαβούλευση, δηλαδή, εφευρίσκω και προσφέρουμε στους πελάτες πώς να λύσουν επιχειρηματικά καθήκοντα με τεχνολογίες πληροφορικής. Οι άνθρωποι έρχονται στη διαβούλευση με διάφορες εμπειρίες, αλλά οι σημαντικότερες ιδιότητες για αυτό το επάγγελμα είναι η ικανότητα να κατανοούν τις ανάγκες του πελάτη, την επιθυμία να βοηθήσουν τους ανθρώπους και τις οργανώσεις, τις καλές δεξιότητες επικοινωνίας και της ομάδας (δεδομένου ότι πάντα συνεργάζεται με τον πελάτη και σε μια ομάδα), καλές αναλυτικές ικανότητες. Το εσωτερικό κίνητρο είναι πολύ σημαντικό: εργαζόμαστε σε ένα ανταγωνιστικό περιβάλλον, και ο πελάτης περιμένει Ασυνήθιστες λύσεις και το ενδιαφέρον για την εργασία.

Τις περισσότερες φορές πρέπει να επικοινωνήσω με τους πελάτες, επισημοποιώντας τις επιχειρηματικές τους ανάγκες και βοήθεια στην ανάπτυξη της πιο κατάλληλης τεχνολογικής αρχιτεκτονικής. Τα κριτήρια επιλογής έχουν τα δικά τους χαρακτηριστικά: Εκτός από τη λειτουργικότητα και το TSO (το συνολικό κόστος ιδιοκτησίας - το συνολικό κόστος ιδιοκτησίας) είναι πολύ σημαντικές, μη λειτουργικές απαιτήσεις για το σύστημα, πιο συχνά, αυτός είναι ο χρόνος απόκρισης, η επεξεργασία πληροφοριών, η επεξεργασία πληροφοριών χρόνος. Για να πείσουμε τον πελάτη, χρησιμοποιούμε συχνά απόδειξη της έννοιας προσέγγισης - προσφέρουμε δωρεάν τεχνολογία "δοκιμών" για κάποια εργασία, σε ένα στενό σύνολο δεδομένων για να βεβαιωθείτε ότι η τεχνολογία λειτουργεί. Η απόφαση θα πρέπει να δημιουργήσει ένα ανταγωνιστικό πλεονέκτημα για τον πελάτη εις βάρος των πρόσθετων πλεονεκτημάτων (για παράδειγμα, το X-Sell, Cross-Sale) ή να λύσει κάποιο είδος επιχειρηματικού προβλήματος, να αναφερθεί, να μειώσει το υψηλό επίπεδο απάτης δανείου.

Θα ήταν πολύ πιο εύκολο αν οι πελάτες προήλθαν από την τελική εργασία, Αλλά εφ 'όσον δεν καταλαβαίνουν ότι εμφανίστηκε μια επαναστατική τεχνολογία, η οποία μπορεί να αλλάξει την αγορά για μερικά χρόνια.

Ποια προβλήματα πρέπει να αντιμετωπίσουν; Η αγορά δεν είναι έτοιμη να χρησιμοποιήσει την τεχνολογία "Big Data". Θα ήταν πολύ πιο εύκολο αν οι πελάτες προήλθαν από ένα έτοιμο έργο, αλλά μέχρι να καταλάβουν ότι μια επαναστατική τεχνολογία που θα μπορούσε να αλλάξει την αγορά για μερικά χρόνια. Αυτός είναι ο λόγος για τον οποίο, στην πραγματικότητα, δουλεύουμε στη λειτουργία εκκίνησης - μην πωλούν μόνο την τεχνολογία, αλλά κάθε φορά που πείθουμε τους πελάτες ότι πρέπει να επενδύσετε σε αυτές τις λύσεις. Αυτή είναι μια τέτοια θέση των οραματηγημένων - παρουσιάζουμε πελάτες πώς μπορείτε να αλλάξετε την επιχείρησή σας με την έλξη των δεδομένων και το. Δημιουργούμε αυτή τη νέα αγορά - η αγορά της εμπορικής που διαβουλεύεται στην περιοχή Big Data.

Εάν ένα άτομο θέλει να συμμετάσχει στην ανάλυση των δεδομένων ή τη διαβούλευση με τη σφαίρα των μεγάλων δεδομένων, τότε το πρώτο πράγμα που είναι σημαντικό είναι η μαθηματική ή η τεχνική εκπαίδευση με καλή μαθηματική προετοιμασία. Είναι επίσης χρήσιμο να κυριαρχήσετε συγκεκριμένες τεχνολογίες, ας πούμε SAS, HADOOP, R LONES ή IBM λύση. Επιπλέον, είναι απαραίτητο να ενδιαφέρεται ενεργά για τα καθήκοντα εφαρμογής για μεγάλα δεδομένα - για παράδειγμα, καθώς μπορούν να χρησιμοποιηθούν για τη βελτίωση της πιστωτικής βαθμολόγησης σε μια τράπεζα ή τη διαχείριση του κύκλου ζωής του πελάτη. Αυτές και άλλες γνώσεις μπορούν να ληφθούν από τις διαθέσιμες πηγές: για παράδειγμα, το Coursera και το μεγάλο πανεπιστήμιο δεδομένων. Υπάρχει επίσης μια πρωτοβουλία αναλυτικών πελατών στο Wharton University of Pennsylvania, το οποίο έχει δημοσιεύσει πολλά ενδιαφέροντα υλικά.

Ένα σοβαρό πρόβλημα για όσους θέλουν να εργαστούν στην περιοχή μας είναι μια ρητή έλλειψη πληροφοριών σχετικά με τα μεγάλα δεδομένα. Δεν μπορείτε να πάτε στο βιβλιοπωλείο ή για κάποιο χώρο και να πάρετε, για παράδειγμα, μια εξαντλητική στήλη περιπτώσεων για όλες τις εφαρμογές μεγάλων τεχνολογιών δεδομένων στις τράπεζες. Δεν υπάρχουν τέτοια βιβλία αναφοράς. Μέρος των πληροφοριών είναι στα βιβλία, ένα άλλο μέρος συλλέγεται σε συνέδρια και σε κάτι που πρέπει να φτάσετε στον εαυτό σας.

Ένα άλλο πρόβλημα είναι ότι οι αναλυτές αισθάνονται καλά στον κόσμο των αριθμών, αλλά δεν είναι πάντα άνετα στην επιχείρηση. Αυτοί οι άνθρωποι συχνά εσωστρεφθούν, είναι δύσκολο για αυτούς να επικοινωνούν και ως εκ τούτου είναι δύσκολο για αυτούς να μεταφέρουν πειστικά στους πελάτες πληροφορίες σχετικά με τα αποτελέσματα της έρευνας. Για την ανάπτυξη αυτών των δεξιοτήτων, θα συνιστούσα τέτοια βιβλία ως "αρχή πυραμίδας", "μιλούν σε διαγράμματα". Βοηθούν στην ανάπτυξη δεξιοτήτων παρουσίασης, συνοπτικά και σαφώς δηλώνει τις σκέψεις τους.

Ήμουν πολύ εξυπηρετικός στη συμμετοχή σε διαφορετικά πρωταθλήματα των περιπτώσεων ενώ σπουδάζουν στο HSE. Τα πρωταθλήματα των περιπτώσεων είναι έξυπνες διαγωνισμοί για τους φοιτητές, όπου πρέπει να μελετήσετε επιχειρηματικά προβλήματα και να προσφέρετε την απόφασή τους. Πρόκειται για δύο είδη: συμβουλευτικά πρωταθλήματα εταιρειών, όπως McKinsey, BCG, Accenture, καθώς και ανεξάρτητο πρωτάθλημα τύπου Changellenge. Κατά τη διάρκεια της συμμετοχής σε αυτά, έμαθα να δούμε και να λύσω σύνθετα καθήκοντα - από τον εντοπισμό του προβλήματος και τη διάρθρωση της στην προστασία των συστάσεων για τη λύση του.

Oleg Mikhalsky για τη ρωσική αγορά και τις ιδιαιτερότητες της δημιουργίας ενός νέου προϊόντος στον τομέα των μεγάλων δεδομένων

Πριν έρθει στην Ακρονή, είχα ήδη ασχοληθεί με την έναρξη νέων προϊόντων στην αγορά σε άλλες εταιρείες. Είναι πάντα ενδιαφέρον και δύσκολο ταυτόχρονα, οπότε ήμουν αμέσως ενδιαφερόμενος για τη δυνατότητα να εργαστούμε Υπηρεσίες Cloud και λύσεις για αποθήκευση δεδομένων. Σε αυτόν τον τομέα, όλη η προηγούμενη εμπειρία μου στη βιομηχανία πληροφορικής ήταν χρήσιμη, συμπεριλαμβανομένου του δικού του έργου εκκίνησης I-Accelerator. Η παρουσία της επιχειρηματικής εκπαίδευσης (MBA) βοήθησε επίσης εκτός από τη βασική μηχανική.

Στη Ρωσία, τις μεγάλες εταιρείες - τράπεζες, τους φορείς εκμετάλλευσης κινητής τηλεφωνίας κ.λπ. - Υπάρχει ανάγκη να αναλυθούν τα μεγάλα δεδομένα, οπότε στη χώρα μας υπάρχουν προοπτικές για όσους θέλουν να εργαστούν σε αυτόν τον τομέα. Είναι αλήθεια ότι πολλά έργα ενσωματώνουν τώρα, δηλαδή, με βάση τις ξένες εξελίξεις ή τις τεχνολογίες του ανοικτού κώδικα. Σε τέτοια έργα, δεν δημιουργούνται θεμελιωδώς νέες προσεγγίσεις και τεχνολογίες, αλλά προσαρμόζονται μάλλον οι υπάρχουσες εξελίξεις. Στην Ακρονή, πήγαμε σε άλλο τρόπο και, μετά την ανάλυση των υφιστάμενων εναλλακτικών λύσεων, αποφάσισα να επενδύσουν στη δική μας ανάπτυξη, δημιουργώντας ένα σύστημα αξιόπιστης αποθήκευσης για μεγάλα δεδομένα, η οποία δεν είναι κατώτερη στο κόστος, για παράδειγμα, το Amazon S3, αλλά λειτουργεί αξιόπιστα και αποτελεσματικά σε μια σημαντικά μικρότερη κλίμακα. Η δική μας ανάπτυξη για μεγάλα δεδομένα είναι επίσης μεταξύ μεγάλων εταιρειών Διαδικτύου, αλλά επικεντρώνονται μάλλον στις εσωτερικές ανάγκες από την ικανοποίηση των αναγκών των εξωτερικών πελατών.

Είναι σημαντικό να κατανοήσουμε τις τάσεις και τις οικονομικές δυνάμεις που επηρεάζουν τον τομέα της επεξεργασίας μεγάλων δεδομένων. Για να το κάνετε αυτό, διαβάστε πολλά, ακούστε τις παραστάσεις των έγκυρων ειδικών στη βιομηχανία πληροφορικής, επισκεφτείτε θεματικά συνέδρια. Τώρα σχεδόν κάθε διάσκεψη έχει ένα μεγάλο τμήμα δεδομένων, αλλά όλοι μιλούν γι 'αυτό σε διαφορετικές γωνίες: από την άποψη της τεχνολογίας, των επιχειρήσεων ή του μάρκετινγκ. Μπορείτε να πάτε για σχεδιασμό εργασίας ή πρακτική άσκηση στην εταιρεία, η οποία ήδη διεξάγει έργα σε αυτό το θέμα. Εάν είστε σίγουροι στις ικανότητές σας, δεν είναι πολύ αργά για να οργανώσετε μια εκκίνηση στη σφαίρα των μεγάλων δεδομένων.

Χωρίς συνεχή επαφή με την αγορά Νέοι αναπτυξιακοί κίνδυνοι

Είναι αλήθεια, όταν είστε υπεύθυνοι για ένα νέο προϊόν, πολύ καιρό πηγαίνει στους αναλυτικούς πελάτες της αγοράς και επικοινωνούν με πιθανούς πελάτες, εταίρους, επαγγελματίες αναλυτές που γνωρίζουν πολλά για τους πελάτες και τις ανάγκες τους. Χωρίς συνεχή επαφή με την αγορά, οι νέοι αναπτυξιακοί κίνδυνοι δεν είναι υποχρεωμένοι. Υπάρχουν πάντα πολλή αβεβαιότητα: πρέπει να καταλάβετε ποιος θα γίνει οι πρώτοι χρήστες (πρώτοι υιοθετητές) που έχετε πολύτιμους γι 'αυτούς και στη συνέχεια προσελκύστε ένα μαζικό κοινό. Το δεύτερο σημαντικότερο καθήκον είναι να σχηματίσουν και να μεταφέρουν στους προγραμματιστές ένα σαφές και ολιστικό όραμα του τελικού προϊόντος για να τους παρακινήσει να εργαστούν υπό τέτοιες προϋποθέσεις όταν ορισμένες απαιτήσεις μπορεί να αλλάξουν και οι προτεραιότητες να εξαρτώνται από τις προτεραιότητες ανατροφοδότησηπου προέρχονται από τους πρώτους πελάτες. Ως εκ τούτου, ένα σημαντικό καθήκον είναι να διαχειριστείτε τις προσδοκίες των πελατών από τη μία πλευρά και τους προγραμματιστές από την άλλη. Έτσι, ούτε οι άλλοι δεν έχουν χάσει ενδιαφέρον και έφεραν το έργο πριν από την ολοκλήρωση. Μετά το πρώτο επιτυχημένο έργο, γίνεται ευκολότερο και το κύριο καθήκον θα βρει το σωστό μοντέλο ανάπτυξης για τη νέα επιχείρηση.

Moscow_exchange 6 Μαΐου 2015 στις 20:38

Μεγάλη αναλυτική αναθεώρηση αγοράς δεδομένων

  • Εταιρεία Blog Moscow Exchange,
  • Μεγάλα δεδομένα.

"Μεγάλα δεδομένα" - το θέμα που συζητείται ενεργά από τις τεχνολογικές εταιρείες. Μερικοί από αυτούς κατάφεραν να απογοητευθούν σε μεγάλα δεδομένα, άλλα - αντίθετα, τα χρησιμοποιούν όσο το δυνατόν περισσότερο για τις επιχειρήσεις ... Φρέσκια αναλυτική επισκόπηση της εγχώριας και παγκόσμιας αγοράς "Μεγάλα Δεδομένα", που προετοιμάστηκε από τη Μόσχα, μαζί με Οι αναλυτές του Ipoboard, δείχνουν ότι οι τάσεις είναι πιο σημαντικές τώρα στην αγορά.. Ελπίζουμε ότι οι πληροφορίες θα είναι ενδιαφέρουσες και χρήσιμες.

Ποια είναι τα μεγάλα δεδομένα;

Βασικά χαρακτηριστικά
Τα μεγάλα δεδομένα, αυτή τη στιγμή, είναι ένας από τους βασικούς οδηγούς για την ανάπτυξη τεχνολογιών της πληροφορίας. Αυτή η κατεύθυνση είναι σχετικά νέα στη ρωσική επιχείρηση, ήταν ευρέως διαδεδομένη στις δυτικές χώρες. Αυτό οφείλεται στο γεγονός ότι στην εποχή των τεχνολογιών της πληροφορίας, ειδικά μετά την άνθηση των κοινωνικών δικτύων, για κάθε χρήστη του Διαδικτύου, μια σημαντική ποσότητα πληροφοριών άρχισε να συσσωρεύεται, η οποία τελικά έδωσε στην κατεύθυνση των μεγάλων δεδομένων.

Ο όρος "μεγάλα δεδομένα" προκαλεί πολλές διαμάχες, πολλοί πιστεύουν ότι αυτό σημαίνει μόνο το ποσό των συσσωρευμένων πληροφοριών, αλλά μην ξεχνάτε την τεχνική πλευρά, αυτή η περιοχή περιλαμβάνει τεχνολογίες αποθήκευσης, υπολογισμούς και επίσης Υπηρεσίες υπηρεσίας.

Πρέπει να σημειωθεί ότι η σφαίρα αναφέρεται στην επεξεργασία μιας μεγάλης ποσότητας πληροφοριών που είναι δύσκολο να επεξεργαστούν τις παραδοσιακές μεθόδους *.

Παρακάτω είναι ένας συγκριτικός πίνακας παραδοσιακής και μεγάλης βάσης δεδομένων.

Το πεδίο εφαρμογής μεγάλων δεδομένων χαρακτηρίζεται από τα ακόλουθα χαρακτηριστικά:
ΕΝΤΑΣΗ ΗΧΟΥ. - Ο όγκος της συσσωρευμένης βάσης δεδομένων είναι μια μεγάλη ποσότητα πληροφοριών που διαχειρίζεται και αποθηκεύει σε παραδοσιακούς τρόπους, απαιτούν νέα προσέγγιση και προηγμένα εργαλεία.
Ταχύτητα. - Ταχύτητα, αυτή η λειτουργία υποδεικνύει ότι τόσο ο αυξανόμενος ρυθμός συσσώρευσης δεδομένων (90% των πληροφοριών έχει συλλεχθεί τα τελευταία 2 χρόνια) και η ταχύτητα επεξεργασίας δεδομένων έγινε πρόσφατα περισσότερο σε ζήτηση επεξεργασίας δεδομένων σε πραγματικό χρόνο.
Ποικιλία. - Πολωνία, δηλ. Τη δυνατότητα ταυτόχρονης επεξεργασίας δομημένων και αδόμητων πληροφοριών διακύμανσης. Η κύρια διαφορά των δομημένων πληροφοριών είναι ότι μπορεί να χαρακτηριστεί. Ένα παράδειγμα τέτοιων πληροφοριών είναι πληροφορίες σχετικά με τις συναλλαγές των πελατών.
Οι μη δομημένες πληροφορίες περιλαμβάνουν βίντεο, αρχεία ήχου, δωρεάν κείμενο, πληροφορίες που προέρχονται από κοινωνικά δίκτυα. Μέχρι σήμερα, το 80% των πληροφοριών περιλαμβάνεται στην ομάδα που δεν είναι δομημένη. Αυτές οι πληροφορίες χρειάζονται μια ολοκληρωμένη ανάλυση για να το καταστήσει χρήσιμο για περαιτέρω επεξεργασία.
Φιλαλήθεια. - Ακρίβεια δεδομένων, οι αυξανόμενες σπουδές έχουν γίνει η σημασία της ακρίβειας των διαθέσιμων δεδομένων. Έτσι, οι εταιρείες του Διαδικτύου έχουν πρόβλημα για τον διαχωρισμό των δράσεων που κατέχονται από ένα ρομπότ και ένα άτομο στην ιστοσελίδα της εταιρείας, η οποία τελικά οδηγεί στη δυσκολία της ανάλυσης δεδομένων.
Αξία. - Αξία συσσωρευμένων πληροφοριών. Τα μεγάλα δεδομένα πρέπει να είναι χρήσιμα για την εταιρεία και να φέρουν κάποια αξία σε αυτό. Για παράδειγμα, για να βοηθήσει στη βελτίωση των επιχειρηματικών διαδικασιών, την εκπόνηση αναφοράς ή βελτιστοποίησης του κόστους.

Σύμφωνα με τη συμμόρφωση με τις παραπάνω 5 συνθήκες, οι συσσωρευμένοι όγκοι των δεδομένων μπορούν να αποδοθούν στον αριθμό των μεγάλων.

Το πεδίο εφαρμογής της χρήσης μεγάλων δεδομένων

Το πεδίο χρήσης της τεχνολογίας μεγάλων δεδομένων είναι εκτεταμένο. Έτσι, με τη βοήθεια μεγάλων δεδομένων, μπορείτε να μάθετε για τις προτιμήσεις των πελατών, την αποτελεσματικότητα των εκστρατειών μάρκετινγκ ή να συμπεριλάβετε κινδύνους. Παρακάτω είναι τα αποτελέσματα της έρευνας του Ινστιτούτου IBM, σχετικά με τις χρήσεις μεγάλων δεδομένων σε εταιρείες.

Όπως φαίνεται από το διάγραμμα, οι περισσότερες εταιρείες χρησιμοποιούν μεγάλα δεδομένα στον τομέα της υπηρεσίας πελατών, η δεύτερη δημοτικότητα της κατεύθυνσης είναι η λειτουργική αποτελεσματικότητα, στον τομέα της διαχείρισης κινδύνου. Τα μεγάλα δεδομένα είναι λιγότερο κοινά αυτή τη στιγμή.

Θα πρέπει επίσης να σημειωθεί ότι τα μεγάλα δεδομένα είναι ένας από τους ταχύτερα αναπτυσσόμενους τομείς των τεχνολογιών της πληροφορίας, σύμφωνα με τις στατιστικές, η συνολική ποσότητα των ληφθέντων και αποθηκευμένων δεδομένων διπλασιάζεται κάθε 1,2 έτη.
Για την περίοδο από το 2012 έως το 2014 το ποσό των μηνιαίων μεταδοτικών δεδομένων Δίκτυα κινητής τηλεφωνίαςαυξήθηκε κατά 81%. Σύμφωνα με τις εκτιμήσεις της Cisco, το 2014, ο όγκος της κινητής επισκεψιμότητας ήταν 2,5 exbaytes (η μονάδα μέτρησης του ποσού των πληροφοριών ίσου με 10 ^ 18 πρότυπων bytes) ανά μήνα, και ήδη το 2019 θα είναι ίσο με 24,3 exabytes.
Έτσι, μεγάλα δεδομένα είναι το ήδη καθορισμένο πεδίο της τεχνολογίας, ακόμη και παρά τη σχετικά μικρή ηλικία της, η οποία διανέμεται σε πολλούς τομείς επιχειρήσεων και διαδραματίζει σημαντικό ρόλο στην ανάπτυξη εταιρειών.

Μεγάλη τεχνολογία δεδομένων
Οι τεχνολογίες που χρησιμοποιούνται για τη συλλογή και επεξεργασία μεγάλων δεδομένων μπορούν να χωριστούν σε 3 ομάδες:
  • Λογισμικό;
  • Εξοπλισμός;
  • Υπηρεσίες υπηρεσίας.

Οι πιο συνηθισμένες προσεγγίσεις επεξεργασίας δεδομένων (λογισμικό) περιλαμβάνουν:
Sql - Γλώσσα δομημένων ερωτημάτων, επιτρέποντας την εργασία με τις βάσεις δεδομένων. Με SQL, μπορείτε να δημιουργήσετε και να τροποποιήσετε τα δεδομένα και το αντίστοιχο σύστημα διαχείρισης βάσεων δεδομένων εμπλέκεται σε έλεγχο της συστοιχίας δεδομένων.
Nosql - Ο όρος δεν αποκρυπτογραφείται ως όχι μόνο SQL (όχι μόνο SQL). Περιλαμβάνει μια σειρά προσεγγίσεων που αποσκοπούν στην εφαρμογή μιας βάσης δεδομένων με διάκριση από μοντέλα που χρησιμοποιούνται σε παραδοσιακά σχεσιακά DBMs. Είναι βολικό να τα χρησιμοποιείτε με μια συνεχώς μεταβαλλόμενη δομή δεδομένων. Για παράδειγμα, για τη συλλογή και την αποθήκευση πληροφοριών σχετικά με τα κοινωνικά δίκτυα.
ΜΕΙΩΣΗ ΧΑΡΤΗ. - μοντέλο διανομής υπολογιστών. Χρησιμοποιείται για παράλληλη υπολογιστική σε πολύ μεγάλα σύνολα δεδομένων (Petabytes * ή περισσότερο). Στη διεπαφή προγραμματισμού, τα μη δεδομένα διαβιβάζονται στην επεξεργασία του προγράμματος και το πρόγραμμα δεδομένων. Έτσι, το αίτημα είναι ένα ξεχωριστό πρόγραμμα. Η αρχή της λειτουργίας συνίσταται σε συνεπή επεξεργασία δεδομένων με δύο χάρτες και τη μείωση μεθόδων. Ο χάρτης επιλέγει προκαταρκτικά δεδομένα, μειώνει τα συσσωματώματα τους.
Hadoop. - Χρησιμοποιείται για την εφαρμογή μηχανισμών αναζήτησης και συμφραζομένων υψηλού φορτωμένου χώρου - Facebook, eBay, Amazon, κλπ. Ένα χαρακτηριστικό γνώρισμα Είναι ότι το σύστημα προστατεύεται από την αποτυχία οποιουδήποτε από τους κόμβους συμπλέγματος, καθώς κάθε μονάδα έχει, τουλάχιστον ένα αντίγραφο των δεδομένων σε έναν άλλο κόμβο.
SAP HANA. - Πλατφόρμα NewsQL υψηλής απόδοσης για αποθήκευση και επεξεργασία δεδομένων. Παρέχει Υψηλή ταχύτητα Επεξεργασία αίτησης. Ένα άλλο διακριτικό χαρακτηριστικό είναι ότι η SAP Hana απλοποιεί το τοπίο του συστήματος, μειώνοντας το κόστος υποστήριξης αναλυτικών συστημάτων.

Ο τεχνολογικός εξοπλισμός περιλαμβάνει:

  • διακομιστές;
  • Εξοπλισμός υποδομής.
Οι διακομιστές περιλαμβάνουν αποθήκες δεδομένων.
Ο εξοπλισμός υποδομής περιλαμβάνει μέσα επιτάχυνσης πλατφόρμες, αδιάλειπτες πηγές ενέργειας, σύνολα κονσολών διακομιστή κ.λπ.

Υπηρεσίες υπηρεσίας.
Οι υπηρεσίες υπηρεσιών περιλαμβάνουν υπηρεσίες για την κατασκευή αρχιτεκτονικής συστήματος βάσης δεδομένων, για τη βελτίωση της υποδομής και για να εξασφαλιστεί η αποθήκευση δεδομένων.

Το λογισμικό, ο εξοπλισμός, καθώς και οι υπηρεσίες εξυπηρέτησης αποτελούν μαζί πλήκτρο πλατφόρμες για την αποθήκευση και την ανάλυση δεδομένων. Οι εταιρείες όπως η Microsoft, η HP, η EMC προσφέρει υπηρεσίες ανάπτυξης, αναπτύσσουν μεγάλες λύσεις δεδομένων και διαχείρισης.

Εφαρμογή σε βιομηχανίες
Τα μεγάλα δεδομένα ήταν ευρέως διαδεδομένα σε πολλά επιχειρηματικά κλαδιά. Χρησιμοποιούνται στην υγειονομική περίθαλψη, τις τηλεπικοινωνίες, το εμπόριο, την εφοδιαστική, τις χρηματοπιστωτικές εταιρείες, καθώς και στη δημόσια διοίκηση.
Παρακάτω είναι διάφορα παραδείγματα της εφαρμογής μεγάλων δεδομένων σε ορισμένες από τις βιομηχανίες.

Λιανεμποριο
Στις βάσεις δεδομένων των καταστημάτων λιανικής πώλησης, πολλές πληροφορίες σχετικά με τους πελάτες, το σύστημα διαχείρισης αποθεμάτων, τα συστήματα εμπορικής παράδοσης μπορούν να συσσωρεύονται. Αυτές οι πληροφορίες ενδέχεται να είναι χρήσιμες σε όλες τις σφαίρες των αγορών.

Έτσι, με τη βοήθεια συσσωρευμένων πληροφοριών, μπορείτε να ελέγξετε την παροχή αγαθών, την αποθήκευση και την πώληση του. Με βάση τις συσσωρευμένες πληροφορίες, μπορείτε να προβλέψετε τη ζήτηση και την παράδοση αγαθών. Επίσης, το σύστημα ανάλυσης επεξεργασίας και δεδομένων μπορεί να επιλυθεί από άλλα προβλήματα λιανικής πώλησης, όπως η βελτιστοποίηση του κόστους ή η προετοιμασία της αναφοράς.

Χρηματοπιστωτικές υπηρεσίες
Τα μεγάλα δεδομένα καθιστούν δυνατή την ανάλυση της πιστοληπτικής ικανότητας του δανειολήπτη, είναι επίσης χρήσιμες για βαθμολόγηση πίστωσης * και αναδοχή **. Η εισαγωγή μεγάλων τεχνολογιών δεδομένων θα μειώσει το χρόνο εξέτασης των πιστώσεων. Με τη βοήθεια μεγάλων δεδομένων, μπορείτε να αναλύσετε τις λειτουργίες ενός συγκεκριμένου πελάτη και να προσφέρετε τις κατάλληλες τραπεζικές υπηρεσίες.

Τηλεπικοινωνία
Στη βιομηχανία τηλεπικοινωνιών, τα μεγάλα δεδομένα ήταν ευρέως διαδεδομένα από τους κινητούς φορείς εκμετάλλευσης.
Φορείς εκμετάλλευσης Κυτταρική επικοινωνία Μαζί με τις χρηματοπιστωτικές οργανώσεις, μια από τις πιο ογκώδεις βάσεις δεδομένων, η οποία τους επιτρέπει να πραγματοποιούν την πιο βαθιά ανάλυση των συσσωρευμένων πληροφοριών.
Ο κύριος σκοπός της ανάλυσης δεδομένων είναι η κατοχή των υφιστάμενων πελατών και η προσέλκυση νέων. Για την εταιρεία αυτή, η κατάτμηση των πελατών, η ανάλυση της κυκλοφορίας τους, καθορίζει την κοινωνική ασφάλιση του συνδρομητή.

Εκτός από τη χρήση μεγάλων δεδομένων σε σκοπούς μάρκετινγκ, η τεχνολογία χρησιμοποιείται για την πρόληψη δόλιων χρηματοπιστωτικών συναλλαγών.

Εξόρυξη και πετρελαϊκή βιομηχανία
Τα μεγάλα δεδομένα χρησιμοποιούνται τόσο σε εξόρυξη όσο και σε επεξεργασία και μάρκετινγκ και μάρκετινγκ. Οι επιχειρήσεις μπορούν με βάση τις ληφθείσες πληροφορίες για την εξαγωγή συμπερασμάτων σχετικά με την αποτελεσματικότητα της ανάπτυξης του τομέα, να παρακολουθήσουν το διάγραμμα των μεγάλων επισκευών και την κατάσταση του εξοπλισμού, προβλέπουν τη ζήτηση για προϊόντα και τιμές.

Σύμφωνα με την έρευνα Tech Pro Research, η μεγαλύτερη διανομή μεγάλων δεδομένων ελήφθη στον κλάδο των τηλεπικοινωνιών, καθώς και στις μηχανικές, οικονομικές και κρατικές επιχειρήσεις. Σύμφωνα με τα αποτελέσματα αυτής της έρευνας, τα μεγάλα δεδομένα στην εκπαίδευση και την υγειονομική περίθαλψη είναι λιγότερο δημοφιλή. Τα αποτελέσματα της έρευνας παρουσιάζονται παρακάτω:

Παραδείγματα χρήσης μεγάλων δεδομένων σε εταιρείες
Μέχρι σήμερα, τα μεγάλα δεδομένα εισάγονται ενεργά σε ξένες εταιρείες. Εταιρείες όπως Nasdaq, Facebook, Google, IBM, Visa, Master Card, Τράπεζα Αμερικής, HSBC, AT & T, Coca Cola, Starbucks και Netflix Χρησιμοποιούν ήδη μεγάλους πόρους δεδομένων.

Το πεδίο εφαρμογής των μεταποιημένων πληροφοριών είναι ποικίλο και ποικίλλει ανάλογα με τη βιομηχανία και τα καθήκοντα που πρέπει να εκτελεστούν.
Στη συνέχεια, θα παρουσιαστούν παραδείγματα της χρήσης μεγάλων τεχνολογιών δεδομένων στην πράξη.

HSBC. Χρησιμοποιεί μεγάλη τεχνολογία δεδομένων για να μετρήσει δόλιες λειτουργίες με πλαστικές κάρτες. Με τη βοήθεια μεγάλων δεδομένων, η εταιρεία αύξησε την αποτελεσματικότητα της υπηρεσίας ασφαλείας 3 φορές, η αναγνώριση των δόλων περιστατικών - 10 φορές. Το οικονομικό αποτέλεσμα της εισαγωγής αυτών των τεχνολογιών ξεπέρασε τα 10 εκατομμύρια δολάρια.

Antifrod * Visa. Επιτρέπει την αυτόματη λειτουργία για τον υπολογισμό των δόλιων λειτουργιών, το σύστημα συνεχίζει να αποτρέψει τις δόλιες πληρωμές αξίας 2 δισεκατομμυρίων δολαρίων ετησίως.

Supercomputer Watson Companies IBM. Αναλύει σε πραγματικό χρόνο τη ροή δεδομένων για τις συναλλαγές χρημάτων. Σύμφωνα με την IBM, ο Watson αυξήθηκε κατά 15% αύξησε τον αριθμό των ανιχνευμένων δόλιων επιχειρήσεων, μειωμένη 50% της ψευδούς αντίδρασης του συστήματος και αύξησε την ποσότητα των κεφαλαίων που προστατεύονται από τις συναλλαγές ενός τέτοιου χαρακτήρα.

Procter & Gamble. Με τη βοήθεια μεγάλων δεδομένων, σχεδιασμού νέων προϊόντων και δημιουργούν παγκόσμιες εκστρατείες μάρκετινγκ. P & G Δημιουργία επιχειρηματικών σφαιρών εξειδικευμένα γραφεία, όπου μπορείτε να δείτε πληροφορίες σε πραγματικό χρόνο.
Έτσι, η διοίκηση της εταιρείας έχει την ευκαιρία να ελέγξει άμεσα τις υποθέσεις και να συμπεριφέρονται πειράματα. P & G πιστεύουν ότι τα μεγάλα δεδομένα είναι χρήσιμα για την πρόβλεψη των δραστηριοτήτων της εταιρείας.

Είδη γραφείου λιανικής πώλησης Officemax. Με τη βοήθεια των γενικών δεδομένων αναλύει τη συμπεριφορά των πελατών. Η μεγάλη ανάλυση δεδομένων κατέστησε δυνατή την αύξηση των εσόδων B2B κατά 13%, μειώστε το κόστος των 400.000 δολαρίων ετησίως.

Σύμφωνα με Κάμπια. Οι διανομείς της υπερβαίνουν ετησίως από 9 έως 18 δισεκατομμύρια δολάρια. Τα δολάρια ΗΠΑ έφτασαν μόνο λόγω του γεγονότος ότι δεν εισάγουν γενικές τεχνολογίες επεξεργασίας δεδομένων. Τα μεγάλα δεδομένα θα επιτρέψουν στους πελάτες να διαχειριστούν αποτελεσματικότερα τον στόλο των αυτοκινήτων, λόγω της ανάλυσης των πληροφοριών που προέρχονται από τους αισθητήρες που είναι εγκατεστημένες στις μηχανές.

Μέχρι σήμερα, είναι ήδη δυνατή η ανάλυση της κατάστασης των βασικών κόμβων, ο βαθμός φθοράς τους, για τη διαχείριση του κόστους και της συντήρησης καυσίμων.

Ομάδα Luxotta. Είναι ένας κατασκευαστής αθλητικών γυαλιών, τέτοιες μάρκες όπως η Ray-Ban, η Persol και ο Oakley. Μεγάλη τεχνολογία δεδομένων Η εταιρεία εφαρμόζεται για να αναλύσει τη συμπεριφορά των δυνητικών πελατών και του "Smart" SMS Marketing. Ως αποτέλεσμα, η Big Data Luxottic Group διατέθηκε πάνω από 100 εκατομμύρια περισσότερους πολύτιμους πελάτες και αύξησε την αποτελεσματικότητα της εκστρατείας μάρκετινγκ κατά 10%.

Χρησιμοποιώντας τους προγραμματιστές παιχνιδιών εργοστασίων Yandex Ο κόσμος των τανκ. Αναλύστε τη συμπεριφορά των παικτών. Μεγάλη τεχνολογία δεδομένων επιτρέπεται να αναλύουν τη συμπεριφορά των 100 χιλιάδων παγκόσμιων παικτών δεξαμενών χρησιμοποιώντας περισσότερες από 100 παραμέτρους (πληροφορίες σχετικά με τις αγορές, τα παιχνίδια, την εμπειρία κ.λπ.). Ως αποτέλεσμα της ανάλυσης, ελήφθη μια πρόβλεψη εκροής χρηστών. Αυτές οι πληροφορίες σάς επιτρέπουν να μειώσετε τη φροντίδα των χρηστών και να εργαστείτε με τους συμμετέχοντες της διεύθυνσης του παιχνιδιού. Το αναπτυγμένο μοντέλο ήταν 20-30% πιο αποτελεσματικό από τα τυποποιημένα μέσα για την ανάλυση της βιομηχανίας τυχερών παιχνιδιών.

Υπουργείο Εργασίας Γερμανία Χρησιμοποιεί μεγάλα δεδομένα στις εργασίες που σχετίζονται με την ανάλυση των αιτήσεων για την έκδοση παροχών ανεργίας. Έτσι, μετά την ανάλυση των πληροφοριών, κατέστη σαφές ότι το 20% των παροχών καταβλήθηκαν αχρεωστήτως. Με τη βοήθεια μεγάλων δεδομένων, το Υπουργείο Εργασίας μείωσε το κόστος των 10 δισεκατομμυρίων ευρώ.

Παιδικό νοσοκομείο Τορόντο Εφαρμοσμένο έργο έργου ARTEMIS. Πρόκειται για ένα σύστημα πληροφοριών που συλλέγει και αναλύει τα δεδομένα σε πραγματικά μωρά σε πραγματικό χρόνο. Το σύστημα κάθε δεύτερης διαδρομής 1260 δεικτών της κατάστασης κάθε παιδιού. Το έργο ARTEMIS σας επιτρέπει να προβλέψετε την ασταθή κατάσταση του παιδιού και να αρχίσετε την πρόληψη ασθενειών στα παιδιά.

Ανασκόπηση της παγκόσμιας αγοράς αγοράς

Την τρέχουσα κατάσταση της παγκόσμιας αγοράς
Το 2014, τα μεγάλα δεδομένα, σύμφωνα με τα συλλογικά στοιχεία, έγιναν ένας από τους τομείς προτεραιότητας των επενδύσεων στον τομέα της βιομηχανίας επιχειρηματικών επιχειρήσεων. Σύμφωνα με τα δεδομένα Πύλη πληροφοριών Ο υπολογιστής συνδέεται με το γεγονός ότι η ανάπτυξη αυτής της κατεύθυνσης άρχισε να φέρει σημαντικά αποτελέσματα για τους χρήστες τους. Κατά το προηγούμενο έτος, ο αριθμός των εταιρειών με υλοποιημένα έργα στον τομέα της διαχείρισης μεγάλων δεδομένων αυξήθηκε κατά 125%, ο όγκος της αγοράς αυξήθηκε κατά 45% σε σχέση με το 2013.

Τα περισσότερα από τα μεγάλα έσοδα της αγοράς δεδομένων, σύμφωνα με το Wikibon, το 2014 ανήλθαν σε υπηρεσίες εξυπηρέτησης, το μερίδιό τους ήταν ίσο με 40% σε συνολικά έσοδα (βλ. Διάγραμμα παρακάτω):

Εάν θεωρείτε μεγάλα δεδομένα για το 2014 σε υποτύπους, η αγορά θα μοιάζει με αυτό:

Σύμφωνα με το Wikibon, οι εφαρμογές και οι Analytics είναι το 36% των μεγάλων εσόδων δεδομένων το 2014 έφερε τις αιτήσεις και την ανάλυση μεγάλων δεδομένων, 17% - εξοπλισμό υπολογιστών και τεχνολογίας αποθήκευσης 15%. Τα ελάχιστα έσοδα προέκυψαν από τις τεχνολογίες NOSQL, τον εξοπλισμό υποδομής και τη δικτύωση των εταιρειών (εταιρικά δίκτυα).

Οι μεγάλες τεχνολογίες δεδομένων είναι πιο δημοφιλείς, όπως πλατφόρμες στη μνήμη του SAP, της Χάνα, της Oracle και άλλων εταιρειών. Τα αποτελέσματα της έρευνας Τ-συστημάτων έδειξαν ότι επιλέχθηκαν το 30% των ερωτηθέντων εταιρειών. Οι δεύτερες δημοφιλέστερες πλατφόρμες NOSQL (18% των χρηστών), επίσης εταιρείες που χρησιμοποιούνται αναλυτικές πλατφόρμες Splunk και Dell, το 15% των εταιρειών επιλέχθηκαν. Το λιγότερο χρήσιμο για την επίλυση των προβλημάτων μεγάλων δεδομένων, τα αποτελέσματα της έρευνας αποδείχτηκαν προϊόντα Hadoop / Maprycure.

Σύμφωνα με την έρευνα Accenture, σε πάνω από το 50% των εταιρειών που χρησιμοποιούν μεγάλη τεχνολογία δεδομένων, τα μεγάλα έξοδα δεδομένων κυμαίνονται από 21% έως 30%.
Σύμφωνα με την ακόλουθη ανάλυση της Accenture, το 76% των εταιρειών, πιστεύει ότι τα έξοδα αυτά θα αυξηθούν το 2015 και το 24% των εταιρειών δεν θα αλλάξει τον προϋπολογισμό τους στην τεχνολογία μεγάλων δεδομένων. Αυτό υποδηλώνει ότι σε αυτές τις εταιρείες τα μεγάλα δεδομένα έχουν γίνει μια ομοσπονδιακή συσκευή πληροφορικής, η οποία έγινε αναπόσπαστο μέρος της ανάπτυξης της εταιρείας.

Τα αποτελέσματα της έρευνας της μονάδας Economist Intelligence Survey επιβεβαιώνουν τη θετική επίδραση από την μεγάλη εφαρμογή δεδομένων. Το 46% των εταιρειών δηλώνουν ότι με τη βοήθεια τεχνολογίας μεγάλων δεδομένων, έχουν βελτιωμένη υπηρεσία πελάτη κατά περισσότερο από 10%, το 33% των εταιρειών βελτιστοποιημένων αποθεματικών και βελτίωσε την παραγωγικότητα των μεγάλων περιουσιακών στοιχείων, το 32% των εταιρειών έχουν βελτιώσει τις διαδικασίες σχεδιασμού.

Μεγάλα δεδομένα σε διάφορες χώρες του κόσμου
Μέχρι σήμερα, η μεγάλη τεχνολογία δεδομένων εισάγεται συχνότερα στις αμερικανικές εταιρείες, αλλά τώρα άλλες χώρες του κόσμου άρχισαν να δείχνουν ενδιαφέρον. Το 2014, σύμφωνα με την IDC, τις χώρες της Ευρώπης, τη Μέση Ανατολή, την Ασία (με εξαίρεση την Ιαπωνία) και την Αφρική αντιπροσώπευαν το 45% του λογισμικού, των υπηρεσιών και του εξοπλισμού στα μεγάλα δεδομένα.

Επίσης, σύμφωνα με την έρευνα CIO, οι εταιρείες από τις χώρες της περιοχής Ασίας-Ειρηνικού αναπτύσσουν ταχέως καινούργιες λύσεις στον τομέα της ανάλυσης μεγάλων δεδομένων, ασφαλή αποθήκευση και τεχνολογία σύννεφων. Η Λατινική Αμερική είναι στη δεύτερη θέση όσον αφορά τον αριθμό των επενδύσεων στην ανάπτυξη μεγάλων τεχνολογιών δεδομένων, πριν από την Ευρώπη και τις Ηνωμένες Πολιτείες.
Στη συνέχεια, θα παρουσιαστούν μια περιγραφή και προβλέψεις για την ανάπτυξη μιας μεγάλης αγοράς δεδομένων για πολλές χώρες.

Κίνα
Οι πληροφορίες της Κίνας είναι 909 exbaytes, το οποίο είναι το 10% των συνολικών πληροφοριών στον κόσμο, μέχρι το 2020 το ποσό των πληροφοριών θα φτάσει τα 8060 exabytes, το μερίδιο των πληροφοριών στις παγκόσμιες στατιστικές θα αυξηθεί και σε 5 χρόνια θα είναι ίσο με 18% . Η πιθανή ανάπτυξη μεγάλων δεδομένων Η Κίνα έχει ένα από τα ταχύτερα αναπτυσσόμενα ηχεία.

Βραζιλία
Η Βραζιλία στα αποτελέσματα του 2014 έχει συσσωρεύσει πληροφορίες σχετικά με 212 exabytes, το οποίο είναι το 3% του παγκόσμιου όγκου. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 1600 exabytes, τα οποία θα είναι το 4% των πληροφοριών ολόκληρου του κόσμου.

Ινδία
Σύμφωνα με το EMC, το ποσό των συσσωρευμένων δεδομένων της Ινδίας σύμφωνα με τα αποτελέσματα του 2014 είναι 326 exbaytes, το οποίο είναι το 5% των συνολικών πληροφοριών. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 2.800 exabytes, τα οποία θα είναι το 6% των πληροφοριών ολόκληρου του κόσμου.

Ιαπωνία
Το ποσό των συσσωρευμένων δεδομένων της Ιαπωνίας σύμφωνα με τα αποτελέσματα του 2014 είναι 495 exbaytes, το οποίο είναι 8% των συνολικών πληροφοριών. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 2.200 Exhaba, αλλά το μερίδιο της αγοράς της Ιαπωνίας θα μειωθεί και θα ανέλθει στο 5% των συνολικών πληροφοριών ολόκληρου του κόσμου.
Έτσι, ο όγκος της αγοράς της Ιαπωνίας θα μειωθεί περισσότερο από 30%.

Γερμανία
Σύμφωνα με την EMC, το ποσό των συσσωρευμένων δεδομένων στη Γερμανία στα τέλη του 2014 είναι 230 exbaytes, το οποίο είναι το 4% των συνολικών πληροφοριών στον κόσμο. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 1100 exabytes και θα είναι 2%.
Στην αγορά της Γερμανίας, ένα μεγάλο μερίδιο των εσόδων, σύμφωνα με τον Όμιλο Experton, θα δημιουργήσει τμήμα υπηρεσιών, του οποίου το μερίδιο του οποίου το 2015 θα είναι το 54% και το 2019 θα αυξηθεί στο 59%, το μερίδιο του λογισμικού και του εξοπλισμού, αντίθετα, μείωση.

Γενικά, ο όγκος της αγοράς θα αυξηθεί από 1, 345 δισ. Ευρώ το 2015 σε 3.198 δισεκατομμύρια ευρώ το 2019, ο μέσος ρυθμός αύξησης θα είναι 24%.
Έτσι, με βάση το Analytics CIO και EMC, μπορεί να συναχθεί το συμπέρασμα ότι οι αναπτυσσόμενες χώρες του κόσμου τα προσεχή έτη θα καταστούν οι αγορές για την ενεργό ανάπτυξη μεγάλων τεχνολογιών δεδομένων.

Κύριες τάσεις της αγοράς
Σύμφωνα με την IDG Enterprise, το 2015, το κόστος των εταιρειών στη σφαίρα μεγάλων δεδομένων θα είναι κατά μέσο όρο 7,4 εκατομμύρια δολάρια για την εταιρεία, οι μεγάλες εταιρείες σκοπεύουν να δαπανήσουν περίπου 13,8 εκατομμύρια δολάρια, μικρά και μεσαία - 1,6 εκατομμύρια δολάρια ΗΠΑ..
Οι περισσότεροι θα επενδυθούν σε περιοχές όπως η ανάλυση και η απεικόνιση των δεδομένων και η συλλογή τους.
Σύμφωνα με τις τρέχουσες τάσεις και ζήτηση στην αγορά, οι επενδύσεις το 2015 θα χρησιμοποιηθούν για τη βελτίωση της ποιότητας των δεδομένων, τη βελτίωση του σχεδιασμού και της πρόβλεψης, καθώς και αύξηση του ποσοστού επεξεργασίας δεδομένων.
Οι εταιρείες του χρηματοπιστωτικού τομέα, σύμφωνα με την ανάλυση ιδεών της εταιρείας Bain, θα γίνουν σε σημαντικές επενδύσεις, έτσι το 2015 σχεδιάζεται να δαπανήσει 6,4 δισεκατομμύρια δολάρια σε μεγάλη τεχνολογία δεδομένων, ο μέσος ρυθμός αύξησης των επενδύσεων θα είναι 22% έως το 2020. Οι εταιρείες στο Διαδίκτυο σχεδιάζουν να δαπανήσουν 2,8 δισεκατομμύρια δολάρια, ο μέσος ρυθμός ανάπτυξης αυξάνεται για μεγάλα δεδομένα θα είναι 26%.
Κατά τη διεξαγωγή έρευνας της έρευνας των οικονομικών πληροφοριών, οι οδηγίες προτεραιότητας της μεγάλης ανάπτυξης δεδομένων εντοπίστηκαν το 2014 και τα επόμενα 3 χρόνια, η κατανομή των απαντήσεων έχει ως εξής:

Σύμφωνα με τις προβλέψεις IDC, οι τάσεις ανάπτυξης της αγοράς μοιάζουν με αυτό:

  • Τα επόμενα 5 χρόνια, το κόστος των λύσεων Cloud στην τεχνολογία μεγάλων δεδομένων θα αυξηθεί 3 φορές ταχύτερα από το κόστος των τοπικών λύσεων. Οι υβριδικές πλατφόρμες για την αποθήκευση δεδομένων θα γίνουν δημοφιλή.
  • Η αύξηση της εφαρμογής που χρησιμοποιεί πολύπλοκα και πρόβλεψη αναλύσεων, συμπεριλαμβανομένης της μάθησης μηχανής, θα επιταχυνθεί το 2015, η αγορά τέτοιων εφαρμογών θα αυξηθεί κατά 65% ταχύτερα από τις εφαρμογές που δεν χρησιμοποιούν αναλύσεις πρόβλεψης.
  • Η ανάλυση των μέσων ενημέρωσης θα τριπλάσια το 2015 και θα αποτελέσει βασικό οδηγό για την αγορά ανάπτυξης μεγάλων τεχνολογιών δεδομένων.
  • Η τάση να εισάγει λύσεις για την ανάλυση της συνεχούς ροής πληροφοριών, το οποίο ισχύει για το Διαδίκτυο των πραγμάτων.
  • Μέχρι το 2018, το 50% των χρηστών θα αλληλεπιδράσει με τις υπηρεσίες που βασίζονται στον γνωστικό υπολογισμό.
Οι οδηγοί και οι περιορισμοί της αγοράς
Οι εμπειρογνώμονες IDC υπογράμμισαν 3 μεγάλους οδηγούς αγοράς δεδομένων 2015:

Σύμφωνα με τη δημοσκόπηση της Accenture, τα θέματα ασφάλειας των δεδομένων αποτελούν τώρα το κύριο εμπόδιο σχετικά με τον τρόπο εφαρμογής των μεγάλων τεχνολογιών δεδομένων, πάνω από το 51% των ερωτηθέντων επιβεβαίωσε ότι ανησυχούν για την εξασφάλιση της προστασίας των δεδομένων και την εμπιστευτικότητα τους. Το 47% των εταιρειών που ανέφεραν την αδυναμία εφαρμογής μεγάλων δεδομένων σε σχέση με έναν περιορισμένο προϋπολογισμό, το 41% \u200b\u200bτων εταιρειών ανέφερε την έλλειψη εξειδικευμένου προσωπικού ως πρόβλημα.

Το Wikibon προβλέπει ότι η μεγάλη αγορά δεδομένων θα αυξηθεί το 2015 σε 38,4 δισεκατομμύρια δολάρια και θα αυξηθεί σε σύγκριση με το προηγούμενο έτος κατά 36%. Κατά τα επόμενα χρόνια, η μείωση των ποσοστών ανάπτυξης στο 10% θα παρατηρηθεί το 2017. Λαμβάνοντας υπόψη τα στοιχεία των προβλέψεων, ο όγκος της αγοράς το 2020 θα ισούται με 68,7 δισεκατομμύρια δολάρια.

Η κατανομή της παγκόσμιας αγοράς μεγάλων δεδομένων σχετικά με τις κατηγορίες των επιχειρήσεων θα μοιάζει με αυτό:

Όπως φαίνεται από το διάγραμμα, η πλειοψηφία της αγοράς θα καταλάβει την τεχνολογία από το πεδίο εφαρμογής της βελτίωσης της υπηρεσίας-πελάτη. Το μάρκετινγκ σημείων θα βρίσκεται σε δεύτερη προτεραιότητα στην εταιρεία μέχρι το 2019, το 2020, σύμφωνα με τη βαριά ανάγνωση, θα δώσει τη θέση τους σε λύσεις για τη βελτίωση της λειτουργικής αποτελεσματικότητας.
Ο υψηλότερος ρυθμός ανάπτυξης θα είναι επίσης στη "Βελτίωση του τμήματος υπηρεσίας πελάτη", η αύξηση είναι 49% ετησίως.
Η πρόβλεψη της αγοράς για μεγάλους υποτύπους δεδομένων θα μοιάζει με αυτό:

Το κυρίαρχο μερίδιο αγοράς, όπως φαίνεται από το διάγραμμα, η κατοχή επαγγελματικών υπηρεσιών, η αύξηση των υψηλότερων ποσοστών θα είναι σε εφαρμογές με αναλύσεις, το μερίδιό τους θα αυξηθεί από το σημερινό 12% έως 18% το 2020 και ο όγκος αυτού του τμήματος θα είναι Ίση με 12,3 δισεκατομμύρια δολάρια, το μερίδιο του υπολογιστικού εξοπλισμού, αντίθετα, θα μειωθεί από 20% σε 14% και θα έχει περίπου 9,3 δισεκατομμύρια δολάρια το 2020, η αγορά τεχνολογιών Cloud θα αυξηθεί σταδιακά και θα φτάσει τα 6,3 δισεκατομμύρια δολάρια, το μερίδιο της αγοράς λύσεων θα φτάσει τα 6,3 δισεκατομμύρια δολάρια. Η αποθήκευση δεδομένων, αντίθετα, θα μειωθεί από 15% το 2014 σε 13% το 2020 και σε νομισματικούς όρους θα είναι 8,9 δισεκατομμύρια δολάρια ΗΠΑ.
Σύμφωνα με την ανάλυση Bain & Company Insights, η μεγάλη διανομή αγοράς δεδομένων από τη βιομηχανία το 2020 θα μοιάζει με αυτό:

  • Η χρηματοπιστωτική βιομηχανία θα ασκήσει το κόστος των μεγάλων δεδομένων ύψους 6,4 δισεκατομμυρίων δολαρίων με μεσαίο ρυθμό αύξησης 22% ετησίως.
  • Οι εταιρείες του Διαδικτύου θα δαπανήσουν 2,8 δισεκατομμύρια δολάρια και ο μέσος ρυθμός αύξησης του κόστους θα είναι κατά 26% κατά τα επόμενα 5 χρόνια.
  • Το κόστος του δημόσιου τομέα θα είναι ανάλογες με το κόστος των εταιρειών Διαδικτύου, αλλά ο ρυθμός ανάπτυξης θα είναι χαμηλότερος - 22%.
  • Ο τομέας των τηλεπικοινωνιών θα αυξηθεί με μέσο ρυθμό αύξησης 40% και θα φθάσει τα 1,2 δισεκατομμύρια δολάρια το 2020 ·

Οι εταιρείες ενέργειας θα επενδύσουν σε αυτές τις τεχνολογίες ένα σχετικά μικρό ποσό - 800 εκατομμύρια δολάρια, αλλά ο ρυθμός ανάπτυξης θα είναι ένα από τα υψηλότερα - 54% ετησίως.
Έτσι, το μεγάλο μερίδιο της μεγάλης αγοράς δεδομένων το 2020 θα καταλάβει τη χρηματοπιστωτική βιομηχανία της εταιρείας και η ενέργεια θα είναι ο ταχύτερα αναπτυσσόμενος τομέας.
Μετά τις προβλέψεις των αναλυτών, ο συνολικός όγκος της αγοράς κατά τα προσεχή έτη θα αυξηθεί. Η ανάπτυξη της αγοράς θα εξασφαλιστεί με την εισαγωγή μεγάλης τεχνολογίας δεδομένων στις αναπτυσσόμενες χώρες του κόσμου, όπως φαίνεται από το παρακάτω πρόγραμμα.

Ο προβλεπόμενος όγκος της αγοράς θα εξαρτηθεί από τον τρόπο με τον οποίο οι αναπτυσσόμενες χώρες θα αντιληφθούν μεγάλες τεχνολογίες δεδομένων εάν είναι επίσης δημοφιλείς όπως στις ανεπτυγμένες χώρες. Το 2014, οι αναπτυσσόμενες χώρες του κόσμου κατέλαβαν το 40% του ποσού των συσσωρευμένων πληροφοριών. Σύμφωνα με την πρόβλεψη EMC, η τρέχουσα δομή της αγοράς, με την κυριαρχία των ανεπτυγμένων χωρών, θα αλλάξει ήδη το 2017. Σύμφωνα με τον αναλυτή EMC, το 2020, το μερίδιο των αναπτυσσόμενων χωρών θα υπερβαίνει το 60%.
Σύμφωνα με την Cisco και την EMC, οι αναπτυσσόμενες χώρες του κόσμου θα συνεργαστούν ενεργά με μεγάλα δεδομένα, από πολλές απόψεις θα συσχετιστούν με τη διαθεσιμότητα της τεχνολογίας και θα συσσωρευτούν επαρκείς πληροφορίες σε μεγάλα δεδομένα. Στο χάρτη του κόσμου που εκπροσωπείται στην επόμενη σελίδα, θα εμφανιστεί μια πρόβλεψη αύξησης του όγκου και του ρυθμού αύξησης των μεγάλων δεδομένων ανά περιοχή.

Ανάλυση της ρωσικής αγοράς

Τρέχουσα κατάσταση της ρωσικής αγοράς

Σύμφωνα με τα αποτελέσματα της μελέτης της CNEWS Analytics και της Oracle, το επίπεδο ωριμότητας της ρωσικής μεγάλης αγοράς δεδομένων έχει αυξηθεί κατά το παρελθόν έτος. Οι ερωτηθέντες που αντιπροσωπεύουν 108 μεγάλες επιχειρήσεις από διαφορετικές βιομηχανίες απέδειξαν υψηλότερο βαθμό συνειδητοποίησης αυτών των τεχνολογιών, καθώς και την τρέχουσα κατανόηση των δυνατοτήτων τέτοιων λύσεων για την επιχείρησή τους.
Από το 2014, σύμφωνα με την IDC, οι 155 πληροφορίες εκκρεμής έχουν συσσωρευτεί στη Ρωσία, η οποία είναι μόνο το 1,8% των παγκόσμιων δεδομένων. Το ποσό των πληροφοριών μέχρι το 2020 θα φθάσει το 980 exabyte και θα διαρκέσει 2,2%. Έτσι, ο μέσος ρυθμός αύξησης του ποσού των πληροφοριών θα είναι 36% ετησίως.
Η IDC αξιολογεί τη ρωσική αγορά στα 340 εκατομμύρια δολάρια, εκ των οποίων 100 εκατομμύρια δολάρια - SAP λύσεις, περίπου 240 εκατομμύρια δολάρια - παρόμοιες λύσεις Oracle, IBM, SAS, Microsoft κλπ.
Ο ρυθμός αύξησης της ρωσικής μεγαλύτερης αγοράς δεδομένων είναι τουλάχιστον 50% ετησίως.
Η διατήρηση της θετικής δυναμικής σε αυτόν τον τομέα της ρωσικής αγοράς πληροφορικής προβλέπεται, ακόμη και σε συνθήκες γενικής στασιμότητας της οικονομίας. Αυτό οφείλεται στο γεγονός ότι η επιχείρηση συνεχίζει να ζητήσει αποφάσεις για τη βελτίωση της αποτελεσματικότητας της εργασίας, καθώς και βελτιστοποίηση κόστους, βελτιώνοντας την ακρίβεια της πρόβλεψης και την ελαχιστοποίηση των πιθανών κινδύνων της εταιρείας.
Οι κύριοι πάροχοι υπηρεσιών στον τομέα των μεγάλων δεδομένων σχετικά με τη ρωσική αγορά είναι:
  • Μαντείο
  • Η Microsoft.
  • Cloudera.
  • Hortonworks.
  • Teradata.
Επισκόπηση της αγοράς από τη βιομηχανία και την εμπειρία στην εφαρμογή μεγάλων δεδομένων σε εταιρείες
Σύμφωνα με το CNEWS, στη Ρωσία, μόνο το 10% των εταιρειών άρχισε να χρησιμοποιεί μεγάλη τεχνολογία δεδομένων όταν στον κόσμο το μερίδιο των εταιρειών αυτών είναι περίπου 30%. Η ετοιμότητα για μεγάλα έργα δεδομένων αυξάνεται σε πολλούς τομείς της ρωσικής οικονομίας - που αποδεικνύεται από την έκθεση του CNEWS Analytics και της Oracle. Περισσότερο από το ένα τρίτο των εταιρειών που εξετάζονται (37%) άρχισαν να εργάζονται με μεγάλες τεχνολογίες δεδομένων, μεταξύ των οποίων το 20% χρησιμοποιεί ήδη τέτοιες λύσεις και το 17% αρχίζει να πειραματιστεί μαζί τους. Το δεύτερο τρίτο των ερωτηθέντων θεωρούν αυτή τη στιγμή μια τέτοια ευκαιρία.

Στη Ρωσία, πιο δημοφιλής με τη μεγάλη τεχνολογία δεδομένων χρησιμοποιείται στον τραπεζικό τομέα και την τηλεπικοινωνία, αλλά είναι επίσης σε ζήτηση στον τομέα της εξορυκτικής βιομηχανίας, της ενέργειας, της λιανικής, στις εταιρείες logistics και του δημόσιου τομέα.
Στη συνέχεια, θα ληφθούν υπόψη παραδείγματα εφαρμογής μεγάλων δεδομένων στις ρωσικές πραγματικότητες.

Τηλεπικοινωνία
Οι φορείς εκμετάλλευσης τηλεπικοινωνιών έχουν μία από τις πιο ογκώδεις βάσεις δεδομένων, οι οποίες τους επιτρέπει να πραγματοποιούν την πιο βαθιά ανάλυση των συσσωρευμένων πληροφοριών.
Μία από τις εφαρμογές της μεγάλης τεχνολογίας δεδομένων είναι να διαχειριστεί την πίστη των συνδρομητών.
Ο κύριος σκοπός της ανάλυσης δεδομένων είναι η κατοχή των υφιστάμενων πελατών και η προσέλκυση νέων. Για την εταιρεία αυτή, η κατάτμηση των πελατών, η ανάλυση της κυκλοφορίας τους, καθορίζει την κοινωνική ασφάλιση του συνδρομητή. Εκτός από τη χρήση πληροφοριών σε σκοπούς μάρκετινγκ, στις τηλεπικοινωνιακές τηλεπικοινωνίες χρησιμοποιούνται για την πρόληψη δόλων χρηματοπιστωτικών συναλλαγών.
Ένα από τα φωτεινά παραδείγματα αυτής της βιομηχανίας είναι ο Vimpelcom. Η εταιρεία εφαρμόζει μεγάλα δεδομένα για τη βελτίωση της ποιότητας των υπηρεσιών στο επίπεδο κάθε συνδρομητή, αναφοράς, ανάλυσης δεδομένων για την ανάπτυξη του δικτύου, την καταπολέμηση της ανεπιθύμητης αλληλογραφίας και την εξατομίκευση των υπηρεσιών.

Τράπεζες
Οι εμπειρογνώμονες από τη χρηματοπιστωτική βιομηχανία πραγματοποιούνται ένα σημαντικό ποσοστό των μεγάλων χρηστών δεδομένων. Ένα από τα επιτυχημένα πειράματα πραγματοποιήθηκε στην τράπεζα Ural για την ανασυγκρότηση και την ανάπτυξη, όπου Βάση πληροφορίες Άρχισε να χρησιμοποιεί για να αναλύσει τους πελάτες, η Τράπεζα άρχισε να προσφέρει εξειδικευμένες πίστωση, καταθέσεις και άλλες υπηρεσίες. Κατά τη διάρκεια της χρήσης αυτών των τεχνολογιών, το χαρτοφυλάκιο λιανικής δανείου της εταιρείας αυξήθηκε κατά 55%.
Μια Alpha Bank αναλύει πληροφορίες από τα κοινωνικά δίκτυα, τις εφαρμογές επεξεργασίας για ένα δάνειο, αναλύει τη συμπεριφορά των χρηστών της ιστοσελίδας της εταιρείας.
Η Sberbank άρχισε επίσης να επεξεργάζεται τη συστοιχία δεδομένων προκειμένου να καταδιώξει τους πελάτες, να αποτρέψουν δόλιες ενέργειες, διαχειριστές και διαχείριση κινδύνων. Στο μέλλον, σχεδιάζεται η βελτίωση της υπηρεσίας και η ανάλυση των ενεργειών των πελατών σε πραγματικό χρόνο.
Η Τράπεζα Περιφερειακής Ανάπτυξης της Ρωσίας αναλύει τη συμπεριφορά των ιδιοκτητών πλαστικών καρτών. Αυτό σας επιτρέπει να εντοπίσετε άτυπες λειτουργίες για έναν συγκεκριμένο πελάτη, αυξάνοντας έτσι την πιθανότητα ανίχνευσης κλοπής μετρητών με πλαστικές κάρτες.

Λιανεμποριο
Στη Ρωσία, η μεγάλη τεχνολογία δεδομένων εισήχθη από εταιρείες τόσο στο διαδίκτυο όσο και το εμπόριο εκτός σύνδεσης. Μέχρι σήμερα, σύμφωνα με το CNEWS Analytics, τα μεγάλα δεδομένα χρησιμοποιούν το 20% των λιανοπωλητών. Το 75% των ειδικών λιανικής θεωρούν τα μεγάλα δεδομένα που απαιτούνται για την ανάπτυξη μιας ανταγωνιστικής στρατηγικής προώθησης της εταιρείας. Σύμφωνα με τα στατιστικά στοιχεία της Hadoop, μετά την εισαγωγή μεγάλων τεχνολογιών δεδομένων, το κέρδος σε εμπορικές οργανώσεις αναπτύσσεται κατά 7-10%.
Οι ειδικοί M.Video μιλούν για τη βελτίωση του σχεδιασμού εφοδιαστικής μετά την εφαρμογή του SAP HANA, ως αποτέλεσμα της εφαρμογής της, η προετοιμασία της ετήσιας αναφοράς μειώθηκε από 10 ημέρες έως 3, ο ρυθμός του καθημερινού φορτίου δεδομένων μειώθηκε από 3 ώρες έως 30 λεπτά.
Wikimart Χρησιμοποιήστε την τεχνολογία δεδομένων για να σχηματίσουν συστάσεις στους επισκέπτες της ιστοσελίδας.
Ένα από τα πρώτα offline καταστήματα εισήγαγε την ανάλυση των μεγάλων δεδομένων στη Ρωσία ήταν "ταινία". Με τη βοήθεια μεγάλων δεδομένων, η λιανική άρχισε να μελετά πληροφορίες σχετικά με τους αγοραστές από επιταγές μετρητών. Ο έμπορος λιανικής πώλησης συλλέγει πληροφορίες για την κατάρτιση συμπεριφορικών μοντέλων, γεγονός που καθιστά δυνατή τη μεγαλύτερη αξιοποίηση αποφάσεων στο επίπεδο λειτουργικών και εμπορικών δραστηριοτήτων.

Βιομηχανία πετρελαίου και φυσικού αερίου
Σε αυτόν τον κλάδο, το πεδίο εφαρμογής της χρήσης μεγάλων δεδομένων είναι αρκετά ευρύ. Μεγάλη τεχνολογία δεδομένων μπορεί να εφαρμοστεί κατά τη διάρκεια της εξόρυξης ορυκτών από το υπέδαφος. Με τη βοήθειά τους, είναι δυνατόν να αναλυθεί η διαδικασία παραγωγής και των πιο αποτελεσματικών τρόπων εξαγόμενου, να παρακολουθήσουν τη διαδικασία γεώτρησης, την ανάλυση της ποιότητας των πρώτων υλών, καθώς και την επεξεργασία και την εμπορία των τελικών προϊόντων. Στη Ρωσία, αυτές οι τεχνολογίες έχουν ήδη γίνει transneft και rosneft.

Κρατικά όργανα
Σε χώρες όπως η Γερμανία, η Αυστραλία, η Ισπανία, η Ιαπωνία, η τεχνολογία της Βραζιλίας και του Πακιστάν, χρησιμοποιούνται για την επίλυση εθνικών ζητημάτων κλίμακας. Αυτές οι τεχνολογίες βοηθούν τις κυβερνητικές αρχές να παρέχουν πιο αποτελεσματικά υπηρεσίες στον πληθυσμό, να παρέχουν στοχοθετημένη κοινωνική στήριξη.
Στη Ρωσία, αυτές οι τεχνολογίες άρχισαν να αναπτύσσουν τέτοια κρατικά όργανα ως ταμείο συνταξιοδότησης, την ομοσπονδιακή φορολογική υπηρεσία και το υποχρεωτικό ταμείο ιατρικής ασφάλισης. Η δυνατότητα εφαρμογής έργων που χρησιμοποιούν μεγάλα δεδομένα είναι μεγάλη, αυτές οι τεχνολογίες θα μπορούσαν να συμβάλουν στη βελτίωση της ποιότητας των υπηρεσιών και, ως εκ τούτου, το βιοτικό επίπεδο του πληθυσμού.

Εφοδιαστική και μεταφορά
Τα μεγάλα δεδομένα μπορούν επίσης να χρησιμοποιηθούν από εταιρείες μεταφορών. Με τη βοήθεια μεγάλων τεχνολογιών δεδομένων, μπορείτε να παρακολουθείτε το πάρκινγκ, να λάβετε υπόψη το κόστος καυσίμων, να παρακολουθήσετε τις εφαρμογές των πελατών.
Οι σιδηρόδρομοι εισήγαγαν μεγάλες τεχνολογίες δεδομένων σε συνδυασμό με το SAP. Αυτές οι τεχνολογίες συνέβαλαν στη μείωση της περιόδου αναφοράς 43,5 φορές (από 14,5 ώρες σε 20 λεπτά), αυξήστε την ακρίβεια της κατανομής του κόστους 40 φορές. Επίσης, εισήχθησαν μεγάλα δεδομένα σχετικά με τις διαδικασίες σχεδιασμού και δασμολογικής ρύθμισης. Ολόκληρες οι εταιρείες χρησιμοποιούν περισσότερα από 300 συστήματα βασισμένα σε λύσεις SAP, συμμετέχουν 4 κέντρα δεδομένων και ο αριθμός των χρηστών ήταν 220.000.

Κύριοι οδηγοί και περιοριστές της αγοράς
Η ανάπτυξη μεγάλων τεχνολογιών δεδομένων στη ρωσική αγορά είναι:
  • Αυξημένο ενδιαφέρον από τους χρήστες στις δυνατότητες μεγάλων δεδομένων, ως μέθοδος αύξησης της ανταγωνιστικότητας της εταιρείας ·
  • Ανάπτυξη μεθόδων επεξεργασίας αρχείων πολυμέσων σε παγκόσμιο επίπεδο.
  • Μεταφορά διακομιστών επεξεργασίας προσωπικών πληροφοριών στο έδαφος της Ρωσίας, σύμφωνα με τον υιοθετημένο νόμο περί αποθήκευσης και επεξεργασίας προσωπικών δεδομένων.
  • Εφαρμογή του τομεακού σχεδίου για την αντικατάσταση εισαγωγής λογισμικού. Το σχέδιο αυτό περιλαμβάνει κρατική στήριξη για τους οικιακούς κατασκευαστές λογισμικού, καθώς και την παροχή προτιμήσεων των εγχώριων προϊόντων πληροφορικής στις προμήθειες για τον κρατικό λογαριασμό.
  • Στη νέα οικονομική κατάσταση, όταν το ποσοστό δολαρίου έχει αυξηθεί σχεδόν 2 φορές, μια τάση θα παρατηρηθεί με όλο και περισσότερη χρήση των φορέων υπηρεσιών ρωσικής υπηρεσίας, παρά ξένους.
  • Τη δημιουργία τεχνικών που προωθούν την ανάπτυξη της αγοράς τεχνολογίας των πληροφοριών, συμπεριλαμβανομένης της αγοράς μεγάλων δεδομένων ·
  • Κρατικό πρόγραμμα για την εισαγωγή συστημάτων δικτύου, η βάση για την οποία χρησιμοποιείται η τεχνολογία μεγάλων δεδομένων.

Τα κύρια εμπόδια στην ανάπτυξη μεγάλων δεδομένων στη ρωσική αγορά είναι:

  • Εξασφάλιση της ασφάλειας και της εμπιστευτικότητας των δεδομένων ·
  • Έλλειψη ειδικευμένου προσωπικού.
  • Ανεπάρκεια των συσσωρευμένων πόρων πληροφόρησης σε μεγάλα δεδομένα στις περισσότερες ρωσικές εταιρείες ·
  • Την πολυπλοκότητα της εισαγωγής νέων τεχνολογιών σε καθιερωμένα συστήματα πληροφοριών των εταιρειών ·
  • Το υψηλό κόστος των μεγάλων τεχνολογιών δεδομένων, η οποία οδηγεί σε περιορισμένο κύκλο επιχειρήσεων που έχουν τη δυνατότητα να εφαρμόσουν αυτές τις τεχνολογίες.
  • Πολιτική και οικονομική αβεβαιότητα που οδήγησαν στην εκροή κεφαλαίου και κατάψυξη επενδυτικών σχεδίων στη Ρωσία ·
  • Οι αυξανόμενες τιμές για τα εισαγόμενα προϊόντα και μια αύξηση του πληθωρισμού, σύμφωνα με την IDC, εμποδίζουν την ανάπτυξη ολόκληρης της αγοράς πληροφορικής.
Πρόβλεψη της ρωσικής αγοράς
Από σήμερα, η ρωσική μεγαλύτερη αγορά δεδομένων δεν είναι τόσο δημοφιλής όσο στις ανεπτυγμένες χώρες. Οι περισσότερες ρωσικές εταιρείες ενδιαφέρονται για αυτό, αλλά δεν λυθούν για να επωφεληθούν από τις δυνατότητές τους.
Παραδείγματα μεγάλων εταιρειών που έχουν ήδη επωφεληθεί από τη χρήση μεγάλων τεχνολογιών δεδομένων, επεκτείνουν την ευαισθητοποίηση αυτών των τεχνολογιών.
Οι αναλυτές διαθέτουν επίσης αισιόδοξες προβλέψεις σχετικά με τη ρωσική αγορά. Η IDC πιστεύει ότι το μερίδιο της ρωσικής αγοράς για τα επόμενα 5 χρόνια θα αυξηθεί, σε αντίθεση με τη γερμανική αγορά και την Ιαπωνία.
Μέχρι το 2020, ο όγκος των μεγάλων δεδομένων Η Ρωσία θα αυξηθεί από το σημερινό 1,8% έως το 2,2% του παγκόσμιου όγκου δεδομένων. Το ποσό των πληροφοριών θα αυξηθεί, σύμφωνα με το EMC, από το τρέχον 155 exabyte έως 980 exbaytes το 2020.
Προς το παρόν, η συσσώρευση πληροφοριών στο επίπεδο των μεγάλων δεδομένων συνεχίζεται στη Ρωσία.
Σύμφωνα με τη δημοσκόπηση της CNEWS Analytics, το 44% των ερωτηθέντων εταιρειών εργάζονται χωρίς περισσότερα από 100 Terabytes * και μόνο το 13% εργάζεται με όγκους άνω των 500 terabytes.

Παρ 'όλα αυτά, η ρωσική αγορά, ακολουθώντας τις παγκόσμιες τάσεις, θα αυξηθεί. Από το 2014, η αγορά IDC εκτιμάται σε 340 εκατομμύρια δολάρια.
Ο ρυθμός αύξησης της αγοράς για τα προηγούμενα έτη ήταν 50% ετησίως εάν παραμείνει στο ίδιο επίπεδο, τότε το 2018 ο όγκος της αγοράς θα φθάσει τα 1,7 δισεκατομμύρια δολάρια. Το μερίδιο της ρωσικής αγοράς στον κόσμο θα είναι περίπου 3%, το οποίο αυξήθηκε από το σημερινό 1,2%.

Τα πιο δεκτικά κλαδιά στη χρήση μεγάλων δεδομένων στη Ρωσία περιλαμβάνουν:

  • Λιανική και τράπεζες, γι 'αυτούς, κυρίως σημαντική ανάλυση της βάσης πελατών, αξιολογώντας την επίδραση των εκστρατειών μάρκετινγκ.
  • Τηλεπικοινωνίες - Τμηματοποίηση της βάσης πελατών και της δημιουργίας κυκλοφορίας.
  • Gossector - Αναφορά, ανάλυση αιτήσεων από τον πληθυσμό κ.λπ.
  • Εταιρείες πετρελαίου - Παρακολούθηση της εργασίας και ο σχεδιασμός της παραγωγής και των πωλήσεων.
  • Οι εταιρείες ενέργειας είναι η δημιουργία ευφυών συστημάτων ηλεκτρικής ενέργειας, επιχειρησιακής παρακολούθησης και πρόβλεψης.
Στις ανεπτυγμένες χώρες, τα μεγάλα δεδομένα ήταν ευρέως διαδεδομένα στους τομείς της υγείας, της ασφάλισης, της μεταλλουργίας, των εταιρειών στο Διαδίκτυο και τις μεταποιητικές επιχειρήσεις, πιθανότατα στο εγγύς μέλλον, οι ρωσικές εταιρείες από αυτές τις περιοχές θα εκτιμήσουν επίσης την επίδραση της εφαρμογής μεγάλων δεδομένων και θα προσαρμόσουν αυτές τις τεχνολογίες στις βιομηχανίες τους.
Στη Ρωσία, καθώς και στον κόσμο, θα παρατηρηθεί μια τάση στο εγγύς μέλλον για την απεικόνιση των δεδομένων, της ανάλυσης των αρχείων πολυμέσων και την ανάπτυξη του Διαδικτύου των πραγμάτων.
Παρά τη συνολική στασιμότητα της οικονομίας, τα προσεχή έτη, οι αναλυτές προβλέπουν περαιτέρω αύξηση της μεγάλης αγοράς δεδομένων, κυρίως οφείλεται στο γεγονός ότι η χρήση μεγάλων τεχνολογιών δεδομένων παρέχει ανταγωνιστικό πλεονέκτημα στους χρήστες της όσον αφορά τη βελτίωση της επιχειρηματικής αποδοτικότητας , προσελκύοντας πρόσθετες ροές πελατών, ελαχιστοποιώντας τους κινδύνους και την ελαχιστοποίηση των τεχνολογιών πρόβλεψης δεδομένων εφαρμογής.
Έτσι, μπορεί να συναχθεί το συμπέρασμα ότι το μεγάλο τμήμα δεδομένων στη Ρωσία βρίσκεται στο στάδιο του σχηματισμού, αλλά η ζήτηση για αυτές τις τεχνολογίες αυξάνεται κάθε χρόνο.

Κύρια Αποτελέσματα Ανάλυση Αγοράς

Παγκόσμια αγορά
Στο τέλος του 2014, η μεγάλη αγορά δεδομένων χαρακτηρίζεται από τις ακόλουθες παραμέτρους:
  • Ο όγκος της αγοράς ανήλθε σε 28,5 δισ. Δολάρια, αύξηση 45% σε σχέση με το προηγούμενο έτος.
  • Τα περισσότερα από τα μεγάλα έσοδα της αγοράς δεδομένων ήταν υπηρεσίες εξυπηρέτησης, το μερίδιό τους ήταν ίσο με 40% σε συνολικά έσοδα.
  • Το 36% των εσόδων άσκησε αιτήσεις και αναλύσεις μεγάλων δεδομένων, 17% - εξοπλισμός υπολογιστών και τεχνολογία αποθήκευσης 15% -
  • Οι πλατφόρμες στη μνήμη, όπως η SAP, η Hana και η Oracle είναι πιο δημοφιλής για την επίλυση των προβλημάτων μεγάλων δεδομένων.
  • Το 125% αύξησε τον αριθμό των εταιρειών με εφαρμοσμένα έργα στον τομέα της μεγάλης διαχείρισης δεδομένων.
Η πρόβλεψη της αγοράς για τα επόμενα έτη έχει ως εξής:
  • Το 2015, ο όγκος της αγοράς θα φθάσει τα 38,4 δισεκατομμύρια δολάρια, το 2020 - 68,7 δισεκατομμύρια δολάρια ΗΠΑ.
  • Ο μέσος ρυθμός ανάπτυξης θα είναι ίσος με 16% ετησίως.
  • Το μέσο κόστος της εταιρείας σε μεγάλη τεχνολογία δεδομένων θα είναι 13,8 εκατομμύρια δολάρια για μεγάλες επιχειρήσεις και 1,6 εκατομμύρια δολάρια για τις μικρές και μεσαίες επιχειρήσεις.
  • Οι τεχνολογίες θα έχουν τη μεγαλύτερη επικράτηση στις σφαίρες της υπηρεσίας πελατών και το μάρκετινγκ σημείων.
  • Το 2017, η παγκόσμια δομή της αγοράς θα αλλάξει προς την επικράτηση των εταιρειών χρηστών από τις αναπτυσσόμενες χώρες.
Ρωσική αγορά
Η ρωσική μεγαλύτερη αγορά δεδομένων βρίσκεται στο στάδιο του σχηματισμού, τα αποτελέσματα του 2014 μοιάζουν με αυτό:
  • Ο όγκος της αγοράς έφθασε 340 εκατομμύρια δολάρια.
  • Ο μέσος ρυθμός αύξησης της αγοράς τα προηγούμενα έτη ανήλθε σε 50% ετησίως.
  • Το συνολικό ποσό των συσσωρευμένων πληροφοριών ανήλθε σε 155 exabytes.
  • Το 10% των ρωσικών εταιρειών άρχισε να χρησιμοποιεί μεγάλη τεχνολογία δεδομένων.
  • Περισσότερη δημοφιλής τεχνολογία μεγάλων δεδομένων που απολαμβάνουν στον τραπεζικό τομέα, τις τηλεπικοινωνίες, τις εταιρείες στο Διαδίκτυο και το λιανικό εμπόριο.
Η πρόβλεψη της ρωσικής αγοράς για τα επόμενα χρόνια έχει ως εξής:
  • Ο όγκος της ρωσικής αγοράς το 2015 θα φτάσει τα 500 εκατομμύρια δολάρια, και το 2018 - 1,7 δισεκατομμύρια δολάρια ΗΠΑ.
  • Το μερίδιο της ρωσικής αγοράς στον κόσμο θα είναι περίπου 3% το 2018.
  • Ο αριθμός των συσσωρευμένων δεδομένων το 2020 θα είναι 980 exabytes.
  • Το ποσό των δεδομένων θα αυξηθεί στο 2,2% των παγκόσμιων δεδομένων των δεδομένων το 2020.
  • Η μεγαλύτερη δημοτικότητα θα αποκτήσει τεχνολογίες απεικόνισης δεδομένων, την ανάλυση των αρχείων πολυμέσων και το διαδίκτυο των πραγμάτων.
Σύμφωνα με τα αποτελέσματα της ανάλυσης, μπορεί να συναχθεί το συμπέρασμα ότι η μεγάλη αγορά δεδομένων εξακολουθεί να βρίσκεται στα αρχικά στάδια ανάπτυξης και στο εγγύς μέλλον θα παρατηρήσουμε την ανάπτυξή της και να επεκτείνουμε τις δυνατότητες αυτών των τεχνολογιών.

Σας ευχαριστούμε που αφιερώσατε το χρόνο να διαβάσετε αυτή τη χύδην εργασία, να εγγραφείτε στο blog μας - υπόσχονται πολλές νέες ενδιαφέρουσες δημοσιεύσεις!

"Μεγάλα δεδομένα" - το θέμα που συζητείται ενεργά από τις τεχνολογικές εταιρείες. Μερικοί από αυτούς κατάφεραν να απογοητευθούν σε μεγάλα δεδομένα, άλλα - αντίθετα, τα χρησιμοποιούν όσο το δυνατόν περισσότερο για τις επιχειρήσεις ... Φρέσκια αναλυτική επισκόπηση της εγχώριας και παγκόσμιας αγοράς "Μεγάλα Δεδομένα", που προετοιμάστηκε από τη Μόσχα, μαζί με Οι αναλυτές του Ipoboard, δείχνουν ότι οι τάσεις είναι πιο σημαντικές τώρα στην αγορά.. Ελπίζουμε ότι οι πληροφορίες θα είναι ενδιαφέρουσες και χρήσιμες.

Ποια είναι τα μεγάλα δεδομένα;

Βασικά χαρακτηριστικά
Τα μεγάλα δεδομένα, αυτή τη στιγμή, είναι ένας από τους βασικούς οδηγούς για την ανάπτυξη τεχνολογιών της πληροφορίας. Αυτή η κατεύθυνση είναι σχετικά νέα στη ρωσική επιχείρηση, ήταν ευρέως διαδεδομένη στις δυτικές χώρες. Αυτό οφείλεται στο γεγονός ότι στην εποχή των τεχνολογιών της πληροφορίας, ειδικά μετά την άνθηση των κοινωνικών δικτύων, για κάθε χρήστη του Διαδικτύου, μια σημαντική ποσότητα πληροφοριών άρχισε να συσσωρεύεται, η οποία τελικά έδωσε στην κατεύθυνση των μεγάλων δεδομένων.

Ο όρος "μεγάλα δεδομένα" προκαλεί πολλές διαμάχες, πολλοί πιστεύουν ότι αυτό σημαίνει μόνο το ποσό των συσσωρευμένων πληροφοριών, αλλά μην ξεχνάτε την τεχνική πλευρά, αυτή η κατεύθυνση περιλαμβάνει τεχνολογίες αποθήκευσης, υπολογισμούς, καθώς και υπηρεσίες εξυπηρέτησης.

Πρέπει να σημειωθεί ότι η σφαίρα αναφέρεται στην επεξεργασία μιας μεγάλης ποσότητας πληροφοριών που είναι δύσκολο να επεξεργαστούν τις παραδοσιακές μεθόδους *.

Παρακάτω είναι ένας συγκριτικός πίνακας παραδοσιακής και μεγάλης βάσης δεδομένων.

Το πεδίο εφαρμογής μεγάλων δεδομένων χαρακτηρίζεται από τα ακόλουθα χαρακτηριστικά:
ΕΝΤΑΣΗ ΗΧΟΥ. - Ο όγκος της συσσωρευμένης βάσης δεδομένων είναι μια μεγάλη ποσότητα πληροφοριών που διαχειρίζεται και αποθηκεύει σε παραδοσιακούς τρόπους, απαιτούν νέα προσέγγιση και προηγμένα εργαλεία.
Ταχύτητα. - Ταχύτητα, αυτή η λειτουργία υποδεικνύει ότι τόσο ο αυξανόμενος ρυθμός συσσώρευσης δεδομένων (90% των πληροφοριών έχει συλλεχθεί τα τελευταία 2 χρόνια) και η ταχύτητα επεξεργασίας δεδομένων έγινε πρόσφατα περισσότερο σε ζήτηση επεξεργασίας δεδομένων σε πραγματικό χρόνο.
Ποικιλία. - Πολωνία, δηλ. Τη δυνατότητα ταυτόχρονης επεξεργασίας δομημένων και αδόμητων πληροφοριών διακύμανσης. Η κύρια διαφορά των δομημένων πληροφοριών είναι ότι μπορεί να χαρακτηριστεί. Ένα παράδειγμα τέτοιων πληροφοριών είναι πληροφορίες σχετικά με τις συναλλαγές των πελατών.
Οι μη δομημένες πληροφορίες περιλαμβάνουν βίντεο, αρχεία ήχου, δωρεάν κείμενο, πληροφορίες που προέρχονται από κοινωνικά δίκτυα. Μέχρι σήμερα, το 80% των πληροφοριών περιλαμβάνεται στην ομάδα που δεν είναι δομημένη. Αυτές οι πληροφορίες χρειάζονται μια ολοκληρωμένη ανάλυση για να το καταστήσει χρήσιμο για περαιτέρω επεξεργασία.
Φιλαλήθεια. - Ακρίβεια δεδομένων, οι αυξανόμενες σπουδές έχουν γίνει η σημασία της ακρίβειας των διαθέσιμων δεδομένων. Έτσι, οι εταιρείες του Διαδικτύου έχουν πρόβλημα για τον διαχωρισμό των δράσεων που κατέχονται από ένα ρομπότ και ένα άτομο στην ιστοσελίδα της εταιρείας, η οποία τελικά οδηγεί στη δυσκολία της ανάλυσης δεδομένων.
Αξία. - Αξία συσσωρευμένων πληροφοριών. Τα μεγάλα δεδομένα πρέπει να είναι χρήσιμα για την εταιρεία και να φέρουν κάποια αξία σε αυτό. Για παράδειγμα, για να βοηθήσει στη βελτίωση των επιχειρηματικών διαδικασιών, την εκπόνηση αναφοράς ή βελτιστοποίησης του κόστους.

Σύμφωνα με τη συμμόρφωση με τις παραπάνω 5 συνθήκες, οι συσσωρευμένοι όγκοι των δεδομένων μπορούν να αποδοθούν στον αριθμό των μεγάλων.

Το πεδίο εφαρμογής της χρήσης μεγάλων δεδομένων

Το πεδίο χρήσης της τεχνολογίας μεγάλων δεδομένων είναι εκτεταμένο. Έτσι, με τη βοήθεια μεγάλων δεδομένων, μπορείτε να μάθετε για τις προτιμήσεις των πελατών, την αποτελεσματικότητα των εκστρατειών μάρκετινγκ ή να συμπεριλάβετε κινδύνους. Παρακάτω είναι τα αποτελέσματα της έρευνας του Ινστιτούτου IBM, σχετικά με τις χρήσεις μεγάλων δεδομένων σε εταιρείες.

Όπως φαίνεται από το διάγραμμα, οι περισσότερες εταιρείες χρησιμοποιούν μεγάλα δεδομένα στον τομέα της υπηρεσίας πελατών, η δεύτερη δημοτικότητα της κατεύθυνσης είναι η λειτουργική αποτελεσματικότητα, στον τομέα της διαχείρισης κινδύνου. Τα μεγάλα δεδομένα είναι λιγότερο κοινά αυτή τη στιγμή.

Θα πρέπει επίσης να σημειωθεί ότι τα μεγάλα δεδομένα είναι ένας από τους ταχύτερα αναπτυσσόμενους τομείς των τεχνολογιών της πληροφορίας, σύμφωνα με τις στατιστικές, η συνολική ποσότητα των ληφθέντων και αποθηκευμένων δεδομένων διπλασιάζεται κάθε 1,2 έτη.
Για την περίοδο από το 2012 έως το 2014, το ποσό των δεδομένων που μεταδίδεται μηνιαίως από δίκτυα κινητής τηλεφωνίας αυξήθηκε κατά 81%. Σύμφωνα με τις εκτιμήσεις της Cisco, το 2014, ο όγκος της κινητής επισκεψιμότητας ήταν 2,5 exbaytes (η μονάδα μέτρησης του ποσού των πληροφοριών ίσου με 10 ^ 18 πρότυπων bytes) ανά μήνα, και ήδη το 2019 θα είναι ίσο με 24,3 exabytes.
Έτσι, μεγάλα δεδομένα είναι το ήδη καθορισμένο πεδίο της τεχνολογίας, ακόμη και παρά τη σχετικά μικρή ηλικία της, η οποία διανέμεται σε πολλούς τομείς επιχειρήσεων και διαδραματίζει σημαντικό ρόλο στην ανάπτυξη εταιρειών.

Μεγάλη τεχνολογία δεδομένων
Οι τεχνολογίες που χρησιμοποιούνται για τη συλλογή και επεξεργασία μεγάλων δεδομένων μπορούν να χωριστούν σε 3 ομάδες:
  • Λογισμικό;
  • Εξοπλισμός;
  • Υπηρεσίες υπηρεσίας.

Οι πιο συνηθισμένες προσεγγίσεις επεξεργασίας δεδομένων (λογισμικό) περιλαμβάνουν:
Sql - Γλώσσα δομημένων ερωτημάτων, επιτρέποντας την εργασία με τις βάσεις δεδομένων. Με SQL, μπορείτε να δημιουργήσετε και να τροποποιήσετε τα δεδομένα και το αντίστοιχο σύστημα διαχείρισης βάσεων δεδομένων εμπλέκεται σε έλεγχο της συστοιχίας δεδομένων.
Nosql - Ο όρος δεν αποκρυπτογραφείται ως όχι μόνο SQL (όχι μόνο SQL). Περιλαμβάνει μια σειρά προσεγγίσεων που αποσκοπούν στην εφαρμογή μιας βάσης δεδομένων με διάκριση από μοντέλα που χρησιμοποιούνται σε παραδοσιακά σχεσιακά DBMs. Είναι βολικό να τα χρησιμοποιείτε με μια συνεχώς μεταβαλλόμενη δομή δεδομένων. Για παράδειγμα, για τη συλλογή και την αποθήκευση πληροφοριών σχετικά με τα κοινωνικά δίκτυα.
ΜΕΙΩΣΗ ΧΑΡΤΗ. - μοντέλο διανομής υπολογιστών. Χρησιμοποιείται για παράλληλη υπολογιστική σε πολύ μεγάλα σύνολα δεδομένων (Petabytes * ή περισσότερο). Στη διεπαφή προγραμματισμού, τα μη δεδομένα διαβιβάζονται στην επεξεργασία του προγράμματος και το πρόγραμμα δεδομένων. Έτσι, το αίτημα είναι ένα ξεχωριστό πρόγραμμα. Η αρχή της λειτουργίας συνίσταται σε συνεπή επεξεργασία δεδομένων με δύο χάρτες και τη μείωση μεθόδων. Ο χάρτης επιλέγει προκαταρκτικά δεδομένα, μειώνει τα συσσωματώματα τους.
Hadoop. - Χρησιμοποιείται για την εφαρμογή μηχανισμών αναζήτησης και συμφραζομένων υψηλού φορτωμένου ιστότοπου - Facebook, eBay, Amazon κλπ. Ένα χαρακτηριστικό χαρακτηριστικό είναι ότι το σύστημα προστατεύεται από την αποτυχία οποιουδήποτε από τους κόμβους συμπλέγματος, καθώς κάθε μπλοκ έχει, τουλάχιστον ένα αντίγραφο του τα δεδομένα στον άλλο κόμβο.
SAP HANA. - Πλατφόρμα NewsQL υψηλής απόδοσης για αποθήκευση και επεξεργασία δεδομένων. Παρέχει ταχύτητες επεξεργασίας υψηλής ταχύτητας. Ένα άλλο διακριτικό χαρακτηριστικό είναι ότι η SAP Hana απλοποιεί το τοπίο του συστήματος, μειώνοντας το κόστος υποστήριξης αναλυτικών συστημάτων.

Ο τεχνολογικός εξοπλισμός περιλαμβάνει:

  • διακομιστές;
  • Εξοπλισμός υποδομής.
Οι διακομιστές περιλαμβάνουν αποθήκες δεδομένων.
Ο εξοπλισμός υποδομής περιλαμβάνει μέσα επιτάχυνσης πλατφόρμες, αδιάλειπτες πηγές ενέργειας, σύνολα κονσολών διακομιστή κ.λπ.

Υπηρεσίες υπηρεσίας.
Οι υπηρεσίες υπηρεσιών περιλαμβάνουν υπηρεσίες για την κατασκευή αρχιτεκτονικής συστήματος βάσης δεδομένων, για τη βελτίωση της υποδομής και για να εξασφαλιστεί η αποθήκευση δεδομένων.

Το λογισμικό, ο εξοπλισμός, καθώς και οι υπηρεσίες εξυπηρέτησης αποτελούν μαζί πλήκτρο πλατφόρμες για την αποθήκευση και την ανάλυση δεδομένων. Οι εταιρείες όπως η Microsoft, η HP, η EMC προσφέρει υπηρεσίες ανάπτυξης, αναπτύσσουν μεγάλες λύσεις δεδομένων και διαχείρισης.

Εφαρμογή σε βιομηχανίες
Τα μεγάλα δεδομένα ήταν ευρέως διαδεδομένα σε πολλά επιχειρηματικά κλαδιά. Χρησιμοποιούνται στην υγειονομική περίθαλψη, τις τηλεπικοινωνίες, το εμπόριο, την εφοδιαστική, τις χρηματοπιστωτικές εταιρείες, καθώς και στη δημόσια διοίκηση.
Παρακάτω είναι διάφορα παραδείγματα της εφαρμογής μεγάλων δεδομένων σε ορισμένες από τις βιομηχανίες.

Λιανεμποριο
Στις βάσεις δεδομένων των καταστημάτων λιανικής πώλησης, πολλές πληροφορίες σχετικά με τους πελάτες, το σύστημα διαχείρισης αποθεμάτων, τα συστήματα εμπορικής παράδοσης μπορούν να συσσωρεύονται. Αυτές οι πληροφορίες ενδέχεται να είναι χρήσιμες σε όλες τις σφαίρες των αγορών.

Έτσι, με τη βοήθεια συσσωρευμένων πληροφοριών, μπορείτε να ελέγξετε την παροχή αγαθών, την αποθήκευση και την πώληση του. Με βάση τις συσσωρευμένες πληροφορίες, μπορείτε να προβλέψετε τη ζήτηση και την παράδοση αγαθών. Επίσης, το σύστημα ανάλυσης επεξεργασίας και δεδομένων μπορεί να επιλυθεί από άλλα προβλήματα λιανικής πώλησης, όπως η βελτιστοποίηση του κόστους ή η προετοιμασία της αναφοράς.

Χρηματοπιστωτικές υπηρεσίες
Τα μεγάλα δεδομένα καθιστούν δυνατή την ανάλυση της πιστοληπτικής ικανότητας του δανειολήπτη, είναι επίσης χρήσιμες για βαθμολόγηση πίστωσης * και αναδοχή **. Η εισαγωγή μεγάλων τεχνολογιών δεδομένων θα μειώσει το χρόνο εξέτασης των πιστώσεων. Με τη βοήθεια μεγάλων δεδομένων, μπορείτε να αναλύσετε τις λειτουργίες ενός συγκεκριμένου πελάτη και να προσφέρετε τις κατάλληλες τραπεζικές υπηρεσίες.

Τηλεπικοινωνία
Στη βιομηχανία τηλεπικοινωνιών, τα μεγάλα δεδομένα ήταν ευρέως διαδεδομένα από τους κινητούς φορείς εκμετάλλευσης.
Οι φορείς εκμετάλλευσης κινητών με τους χρηματοπιστωτικούς οργανισμούς έχουν μία από τις πιο ογκώδεις βάσεις δεδομένων, οι οποίες τους επιτρέπει να πραγματοποιούν την πιο βαθιά ανάλυση των συσσωρευμένων πληροφοριών.
Ο κύριος σκοπός της ανάλυσης δεδομένων είναι η κατοχή των υφιστάμενων πελατών και η προσέλκυση νέων. Για την εταιρεία αυτή, η κατάτμηση των πελατών, η ανάλυση της κυκλοφορίας τους, καθορίζει την κοινωνική ασφάλιση του συνδρομητή.

Εκτός από τη χρήση μεγάλων δεδομένων σε σκοπούς μάρκετινγκ, η τεχνολογία χρησιμοποιείται για την πρόληψη δόλιων χρηματοπιστωτικών συναλλαγών.

Εξόρυξη και πετρελαϊκή βιομηχανία
Τα μεγάλα δεδομένα χρησιμοποιούνται τόσο σε εξόρυξη όσο και σε επεξεργασία και μάρκετινγκ και μάρκετινγκ. Οι επιχειρήσεις μπορούν με βάση τις ληφθείσες πληροφορίες για την εξαγωγή συμπερασμάτων σχετικά με την αποτελεσματικότητα της ανάπτυξης του τομέα, να παρακολουθήσουν το διάγραμμα των μεγάλων επισκευών και την κατάσταση του εξοπλισμού, προβλέπουν τη ζήτηση για προϊόντα και τιμές.

Σύμφωνα με την έρευνα Tech Pro Research, η μεγαλύτερη διανομή μεγάλων δεδομένων ελήφθη στον κλάδο των τηλεπικοινωνιών, καθώς και στις μηχανικές, οικονομικές και κρατικές επιχειρήσεις. Σύμφωνα με τα αποτελέσματα αυτής της έρευνας, τα μεγάλα δεδομένα στην εκπαίδευση και την υγειονομική περίθαλψη είναι λιγότερο δημοφιλή. Τα αποτελέσματα της έρευνας παρουσιάζονται παρακάτω:

Παραδείγματα χρήσης μεγάλων δεδομένων σε εταιρείες
Μέχρι σήμερα, τα μεγάλα δεδομένα εισάγονται ενεργά σε ξένες εταιρείες. Εταιρείες όπως Nasdaq, Facebook, Google, IBM, Visa, Master Card, Τράπεζα Αμερικής, HSBC, AT & T, Coca Cola, Starbucks και Netflix Χρησιμοποιούν ήδη μεγάλους πόρους δεδομένων.

Το πεδίο εφαρμογής των μεταποιημένων πληροφοριών είναι ποικίλο και ποικίλλει ανάλογα με τη βιομηχανία και τα καθήκοντα που πρέπει να εκτελεστούν.
Στη συνέχεια, θα παρουσιαστούν παραδείγματα της χρήσης μεγάλων τεχνολογιών δεδομένων στην πράξη.

HSBC. Χρησιμοποιεί μεγάλη τεχνολογία δεδομένων για να μετρήσει δόλιες λειτουργίες με πλαστικές κάρτες. Με τη βοήθεια μεγάλων δεδομένων, η εταιρεία αύξησε την αποτελεσματικότητα της υπηρεσίας ασφαλείας 3 φορές, η αναγνώριση των δόλων περιστατικών - 10 φορές. Το οικονομικό αποτέλεσμα της εισαγωγής αυτών των τεχνολογιών ξεπέρασε τα 10 εκατομμύρια δολάρια.

Antifrod * Visa. Επιτρέπει την αυτόματη λειτουργία για τον υπολογισμό των δόλιων λειτουργιών, το σύστημα συνεχίζει να αποτρέψει τις δόλιες πληρωμές αξίας 2 δισεκατομμυρίων δολαρίων ετησίως.

Supercomputer Watson Companies IBM. Αναλύει σε πραγματικό χρόνο τη ροή δεδομένων για τις συναλλαγές χρημάτων. Σύμφωνα με την IBM, ο Watson αυξήθηκε κατά 15% αύξησε τον αριθμό των ανιχνευμένων δόλιων επιχειρήσεων, μειωμένη 50% της ψευδούς αντίδρασης του συστήματος και αύξησε την ποσότητα των κεφαλαίων που προστατεύονται από τις συναλλαγές ενός τέτοιου χαρακτήρα.

Procter & Gamble. Με τη βοήθεια μεγάλων δεδομένων, σχεδιασμού νέων προϊόντων και δημιουργούν παγκόσμιες εκστρατείες μάρκετινγκ. P & G Δημιουργία επιχειρηματικών σφαιρών εξειδικευμένα γραφεία, όπου μπορείτε να δείτε πληροφορίες σε πραγματικό χρόνο.
Έτσι, η διοίκηση της εταιρείας έχει την ευκαιρία να ελέγξει άμεσα τις υποθέσεις και να συμπεριφέρονται πειράματα. P & G πιστεύουν ότι τα μεγάλα δεδομένα είναι χρήσιμα για την πρόβλεψη των δραστηριοτήτων της εταιρείας.

Είδη γραφείου λιανικής πώλησης Officemax. Με τη βοήθεια των γενικών δεδομένων αναλύει τη συμπεριφορά των πελατών. Η μεγάλη ανάλυση δεδομένων κατέστησε δυνατή την αύξηση των εσόδων B2B κατά 13%, μειώστε το κόστος των 400.000 δολαρίων ετησίως.

Σύμφωνα με Κάμπια. Οι διανομείς της υπερβαίνουν ετησίως από 9 έως 18 δισεκατομμύρια δολάρια. Τα δολάρια ΗΠΑ έφτασαν μόνο λόγω του γεγονότος ότι δεν εισάγουν γενικές τεχνολογίες επεξεργασίας δεδομένων. Τα μεγάλα δεδομένα θα επιτρέψουν στους πελάτες να διαχειριστούν αποτελεσματικότερα τον στόλο των αυτοκινήτων, λόγω της ανάλυσης των πληροφοριών που προέρχονται από τους αισθητήρες που είναι εγκατεστημένες στις μηχανές.

Μέχρι σήμερα, είναι ήδη δυνατή η ανάλυση της κατάστασης των βασικών κόμβων, ο βαθμός φθοράς τους, για τη διαχείριση του κόστους και της συντήρησης καυσίμων.

Ομάδα Luxotta. Είναι ένας κατασκευαστής αθλητικών γυαλιών, τέτοιες μάρκες όπως η Ray-Ban, η Persol και ο Oakley. Μεγάλη τεχνολογία δεδομένων Η εταιρεία εφαρμόζεται για να αναλύσει τη συμπεριφορά των δυνητικών πελατών και του "Smart" SMS Marketing. Ως αποτέλεσμα, η Big Data Luxottic Group διατέθηκε πάνω από 100 εκατομμύρια περισσότερους πολύτιμους πελάτες και αύξησε την αποτελεσματικότητα της εκστρατείας μάρκετινγκ κατά 10%.

Χρησιμοποιώντας τους προγραμματιστές παιχνιδιών εργοστασίων Yandex Ο κόσμος των τανκ. Αναλύστε τη συμπεριφορά των παικτών. Μεγάλη τεχνολογία δεδομένων επιτρέπεται να αναλύουν τη συμπεριφορά των 100 χιλιάδων παγκόσμιων παικτών δεξαμενών χρησιμοποιώντας περισσότερες από 100 παραμέτρους (πληροφορίες σχετικά με τις αγορές, τα παιχνίδια, την εμπειρία κ.λπ.). Ως αποτέλεσμα της ανάλυσης, ελήφθη μια πρόβλεψη εκροής χρηστών. Αυτές οι πληροφορίες σάς επιτρέπουν να μειώσετε τη φροντίδα των χρηστών και να εργαστείτε με τους συμμετέχοντες της διεύθυνσης του παιχνιδιού. Το αναπτυγμένο μοντέλο ήταν 20-30% πιο αποτελεσματικό από τα τυποποιημένα μέσα για την ανάλυση της βιομηχανίας τυχερών παιχνιδιών.

Υπουργείο Εργασίας Γερμανία Χρησιμοποιεί μεγάλα δεδομένα στις εργασίες που σχετίζονται με την ανάλυση των αιτήσεων για την έκδοση παροχών ανεργίας. Έτσι, μετά την ανάλυση των πληροφοριών, κατέστη σαφές ότι το 20% των παροχών καταβλήθηκαν αχρεωστήτως. Με τη βοήθεια μεγάλων δεδομένων, το Υπουργείο Εργασίας μείωσε το κόστος των 10 δισεκατομμυρίων ευρώ.

Παιδικό νοσοκομείο Τορόντο Εφαρμοσμένο έργο έργου ARTEMIS. Πρόκειται για ένα σύστημα πληροφοριών που συλλέγει και αναλύει τα δεδομένα σε πραγματικά μωρά σε πραγματικό χρόνο. Το σύστημα κάθε δεύτερης διαδρομής 1260 δεικτών της κατάστασης κάθε παιδιού. Το έργο ARTEMIS σας επιτρέπει να προβλέψετε την ασταθή κατάσταση του παιδιού και να αρχίσετε την πρόληψη ασθενειών στα παιδιά.

Ανασκόπηση της παγκόσμιας αγοράς αγοράς

Την τρέχουσα κατάσταση της παγκόσμιας αγοράς
Το 2014, τα μεγάλα δεδομένα, σύμφωνα με τα συλλογικά στοιχεία, έγιναν ένας από τους τομείς προτεραιότητας των επενδύσεων στον τομέα της βιομηχανίας επιχειρηματικών επιχειρήσεων. Σύμφωνα με την πύλη πληροφοριών του υπολογιστή, αυτό οφείλεται στο γεγονός ότι η ανάπτυξη αυτής της κατεύθυνσης άρχισε να φέρει σημαντικά αποτελέσματα για τους χρήστες τους. Κατά το προηγούμενο έτος, ο αριθμός των εταιρειών με υλοποιημένα έργα στον τομέα της διαχείρισης μεγάλων δεδομένων αυξήθηκε κατά 125%, ο όγκος της αγοράς αυξήθηκε κατά 45% σε σχέση με το 2013.

Τα περισσότερα από τα μεγάλα έσοδα της αγοράς δεδομένων, σύμφωνα με το Wikibon, το 2014 ανήλθαν σε υπηρεσίες εξυπηρέτησης, το μερίδιό τους ήταν ίσο με 40% σε συνολικά έσοδα (βλ. Διάγραμμα παρακάτω):

Εάν θεωρείτε μεγάλα δεδομένα για το 2014 σε υποτύπους, η αγορά θα μοιάζει με αυτό:

Σύμφωνα με το Wikibon, οι εφαρμογές και οι Analytics είναι το 36% των μεγάλων εσόδων δεδομένων το 2014 έφερε τις αιτήσεις και την ανάλυση μεγάλων δεδομένων, 17% - εξοπλισμό υπολογιστών και τεχνολογίας αποθήκευσης 15%. Τα ελάχιστα έσοδα προέκυψαν από τις τεχνολογίες NOSQL, τον εξοπλισμό υποδομής και τη δικτύωση των εταιρειών (εταιρικά δίκτυα).

Οι μεγάλες τεχνολογίες δεδομένων είναι πιο δημοφιλείς, όπως πλατφόρμες στη μνήμη του SAP, της Χάνα, της Oracle και άλλων εταιρειών. Τα αποτελέσματα της έρευνας Τ-συστημάτων έδειξαν ότι επιλέχθηκαν το 30% των ερωτηθέντων εταιρειών. Οι δεύτερες δημοφιλέστερες πλατφόρμες NOSQL (18% των χρηστών), επίσης εταιρείες που χρησιμοποιούνται αναλυτικές πλατφόρμες Splunk και Dell, το 15% των εταιρειών επιλέχθηκαν. Το λιγότερο χρήσιμο για την επίλυση των προβλημάτων μεγάλων δεδομένων, τα αποτελέσματα της έρευνας αποδείχτηκαν προϊόντα Hadoop / Maprycure.

Σύμφωνα με την έρευνα Accenture, σε πάνω από το 50% των εταιρειών που χρησιμοποιούν μεγάλη τεχνολογία δεδομένων, τα μεγάλα έξοδα δεδομένων κυμαίνονται από 21% έως 30%.
Σύμφωνα με την ακόλουθη ανάλυση της Accenture, το 76% των εταιρειών, πιστεύει ότι τα έξοδα αυτά θα αυξηθούν το 2015 και το 24% των εταιρειών δεν θα αλλάξει τον προϋπολογισμό τους στην τεχνολογία μεγάλων δεδομένων. Αυτό υποδηλώνει ότι σε αυτές τις εταιρείες τα μεγάλα δεδομένα έχουν γίνει μια ομοσπονδιακή συσκευή πληροφορικής, η οποία έγινε αναπόσπαστο μέρος της ανάπτυξης της εταιρείας.

Τα αποτελέσματα της έρευνας της μονάδας Economist Intelligence Survey επιβεβαιώνουν τη θετική επίδραση από την μεγάλη εφαρμογή δεδομένων. Το 46% των εταιρειών δηλώνουν ότι με τη βοήθεια τεχνολογίας μεγάλων δεδομένων, έχουν βελτιωμένη υπηρεσία πελάτη κατά περισσότερο από 10%, το 33% των εταιρειών βελτιστοποιημένων αποθεματικών και βελτίωσε την παραγωγικότητα των μεγάλων περιουσιακών στοιχείων, το 32% των εταιρειών έχουν βελτιώσει τις διαδικασίες σχεδιασμού.

Μεγάλα δεδομένα σε διάφορες χώρες του κόσμου
Μέχρι σήμερα, η μεγάλη τεχνολογία δεδομένων εισάγεται συχνότερα στις αμερικανικές εταιρείες, αλλά τώρα άλλες χώρες του κόσμου άρχισαν να δείχνουν ενδιαφέρον. Το 2014, σύμφωνα με την IDC, τις χώρες της Ευρώπης, τη Μέση Ανατολή, την Ασία (με εξαίρεση την Ιαπωνία) και την Αφρική αντιπροσώπευαν το 45% του λογισμικού, των υπηρεσιών και του εξοπλισμού στα μεγάλα δεδομένα.

Επίσης, σύμφωνα με την έρευνα CIO, η εταιρεία από τις χώρες της περιοχής Ασίας-Ειρηνικού αναπτύσσει γρήγορα νέες λύσεις στον τομέα της μεγάλης ανάλυσης δεδομένων, της ασφαλούς αποθήκευσης και των τεχνολογιών σύννεφων. Η Λατινική Αμερική είναι στη δεύτερη θέση όσον αφορά τον αριθμό των επενδύσεων στην ανάπτυξη μεγάλων τεχνολογιών δεδομένων, πριν από την Ευρώπη και τις Ηνωμένες Πολιτείες.
Στη συνέχεια, θα παρουσιαστούν μια περιγραφή και προβλέψεις για την ανάπτυξη μιας μεγάλης αγοράς δεδομένων για πολλές χώρες.

Κίνα
Οι πληροφορίες της Κίνας είναι 909 exbaytes, το οποίο είναι το 10% των συνολικών πληροφοριών στον κόσμο, μέχρι το 2020 το ποσό των πληροφοριών θα φτάσει τα 8060 exabytes, το μερίδιο των πληροφοριών στις παγκόσμιες στατιστικές θα αυξηθεί και σε 5 χρόνια θα είναι ίσο με 18% . Η πιθανή ανάπτυξη μεγάλων δεδομένων Η Κίνα έχει ένα από τα ταχύτερα αναπτυσσόμενα ηχεία.

Βραζιλία
Η Βραζιλία στα αποτελέσματα του 2014 έχει συσσωρεύσει πληροφορίες σχετικά με 212 exabytes, το οποίο είναι το 3% του παγκόσμιου όγκου. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 1600 exabytes, τα οποία θα είναι το 4% των πληροφοριών ολόκληρου του κόσμου.

Ινδία
Σύμφωνα με το EMC, το ποσό των συσσωρευμένων δεδομένων της Ινδίας σύμφωνα με τα αποτελέσματα του 2014 είναι 326 exbaytes, το οποίο είναι το 5% των συνολικών πληροφοριών. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 2.800 exabytes, τα οποία θα είναι το 6% των πληροφοριών ολόκληρου του κόσμου.

Ιαπωνία
Το ποσό των συσσωρευμένων δεδομένων της Ιαπωνίας σύμφωνα με τα αποτελέσματα του 2014 είναι 495 exbaytes, το οποίο είναι 8% των συνολικών πληροφοριών. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 2.200 Exhaba, αλλά το μερίδιο της αγοράς της Ιαπωνίας θα μειωθεί και θα ανέλθει στο 5% των συνολικών πληροφοριών ολόκληρου του κόσμου.
Έτσι, ο όγκος της αγοράς της Ιαπωνίας θα μειωθεί περισσότερο από 30%.

Γερμανία
Σύμφωνα με την EMC, το ποσό των συσσωρευμένων δεδομένων στη Γερμανία στα τέλη του 2014 είναι 230 exbaytes, το οποίο είναι το 4% των συνολικών πληροφοριών στον κόσμο. Μέχρι το 2020, το ποσό των πληροφοριών θα αυξηθεί σε 1100 exabytes και θα είναι 2%.
Στην αγορά της Γερμανίας, ένα μεγάλο μερίδιο των εσόδων, σύμφωνα με τον Όμιλο Experton, θα δημιουργήσει τμήμα υπηρεσιών, του οποίου το μερίδιο του οποίου το 2015 θα είναι το 54% και το 2019 θα αυξηθεί στο 59%, το μερίδιο του λογισμικού και του εξοπλισμού, αντίθετα, μείωση.

Γενικά, ο όγκος της αγοράς θα αυξηθεί από 1, 345 δισ. Ευρώ το 2015 σε 3.198 δισεκατομμύρια ευρώ το 2019, ο μέσος ρυθμός αύξησης θα είναι 24%.
Έτσι, με βάση το Analytics CIO και EMC, μπορεί να συναχθεί το συμπέρασμα ότι οι αναπτυσσόμενες χώρες του κόσμου τα προσεχή έτη θα καταστούν οι αγορές για την ενεργό ανάπτυξη μεγάλων τεχνολογιών δεδομένων.

Κύριες τάσεις της αγοράς
Σύμφωνα με την IDG Enterprise, το 2015, το κόστος των εταιρειών στη σφαίρα μεγάλων δεδομένων θα είναι κατά μέσο όρο 7,4 εκατομμύρια δολάρια για την εταιρεία, οι μεγάλες εταιρείες σκοπεύουν να δαπανήσουν περίπου 13,8 εκατομμύρια δολάρια, μικρά και μεσαία - 1,6 εκατομμύρια δολάρια ΗΠΑ..
Οι περισσότεροι θα επενδυθούν σε περιοχές όπως η ανάλυση και η απεικόνιση των δεδομένων και η συλλογή τους.
Σύμφωνα με τις τρέχουσες τάσεις και ζήτηση στην αγορά, οι επενδύσεις το 2015 θα χρησιμοποιηθούν για τη βελτίωση της ποιότητας των δεδομένων, τη βελτίωση του σχεδιασμού και της πρόβλεψης, καθώς και αύξηση του ποσοστού επεξεργασίας δεδομένων.
Οι εταιρείες του χρηματοπιστωτικού τομέα, σύμφωνα με την ανάλυση ιδεών της εταιρείας Bain, θα γίνουν σε σημαντικές επενδύσεις, έτσι το 2015 σχεδιάζεται να δαπανήσει 6,4 δισεκατομμύρια δολάρια σε μεγάλη τεχνολογία δεδομένων, ο μέσος ρυθμός αύξησης των επενδύσεων θα είναι 22% έως το 2020. Οι εταιρείες στο Διαδίκτυο σχεδιάζουν να δαπανήσουν 2,8 δισεκατομμύρια δολάρια, ο μέσος ρυθμός ανάπτυξης αυξάνεται για μεγάλα δεδομένα θα είναι 26%.
Κατά τη διεξαγωγή έρευνας της έρευνας των οικονομικών πληροφοριών, οι οδηγίες προτεραιότητας της μεγάλης ανάπτυξης δεδομένων εντοπίστηκαν το 2014 και τα επόμενα 3 χρόνια, η κατανομή των απαντήσεων έχει ως εξής:

Σύμφωνα με τις προβλέψεις IDC, οι τάσεις ανάπτυξης της αγοράς μοιάζουν με αυτό:

  • Τα επόμενα 5 χρόνια, το κόστος των λύσεων Cloud στην τεχνολογία μεγάλων δεδομένων θα αυξηθεί 3 φορές ταχύτερα από το κόστος των τοπικών λύσεων. Οι υβριδικές πλατφόρμες για την αποθήκευση δεδομένων θα γίνουν δημοφιλή.
  • Η αύξηση της εφαρμογής που χρησιμοποιεί πολύπλοκα και πρόβλεψη αναλύσεων, συμπεριλαμβανομένης της μάθησης μηχανής, θα επιταχυνθεί το 2015, η αγορά τέτοιων εφαρμογών θα αυξηθεί κατά 65% ταχύτερα από τις εφαρμογές που δεν χρησιμοποιούν αναλύσεις πρόβλεψης.
  • Η ανάλυση των μέσων ενημέρωσης θα τριπλάσια το 2015 και θα αποτελέσει βασικό οδηγό για την αγορά ανάπτυξης μεγάλων τεχνολογιών δεδομένων.
  • Η τάση να εισάγει λύσεις για την ανάλυση της συνεχούς ροής πληροφοριών, το οποίο ισχύει για το Διαδίκτυο των πραγμάτων.
  • Μέχρι το 2018, το 50% των χρηστών θα αλληλεπιδράσει με τις υπηρεσίες που βασίζονται στον γνωστικό υπολογισμό.
Οι οδηγοί και οι περιορισμοί της αγοράς
Οι εμπειρογνώμονες IDC υπογράμμισαν 3 μεγάλους οδηγούς αγοράς δεδομένων 2015:

Σύμφωνα με τη δημοσκόπηση της Accenture, τα θέματα ασφάλειας των δεδομένων αποτελούν τώρα το κύριο εμπόδιο σχετικά με τον τρόπο εφαρμογής των μεγάλων τεχνολογιών δεδομένων, πάνω από το 51% των ερωτηθέντων επιβεβαίωσε ότι ανησυχούν για την εξασφάλιση της προστασίας των δεδομένων και την εμπιστευτικότητα τους. Το 47% των εταιρειών που ανέφεραν την αδυναμία εφαρμογής μεγάλων δεδομένων σε σχέση με έναν περιορισμένο προϋπολογισμό, το 41% \u200b\u200bτων εταιρειών ανέφερε την έλλειψη εξειδικευμένου προσωπικού ως πρόβλημα.

Το Wikibon προβλέπει ότι η μεγάλη αγορά δεδομένων θα αυξηθεί το 2015 σε 38,4 δισεκατομμύρια δολάρια και θα αυξηθεί σε σύγκριση με το προηγούμενο έτος κατά 36%. Κατά τα επόμενα χρόνια, η μείωση των ποσοστών ανάπτυξης στο 10% θα παρατηρηθεί το 2017. Λαμβάνοντας υπόψη τα στοιχεία των προβλέψεων, ο όγκος της αγοράς το 2020 θα ισούται με 68,7 δισεκατομμύρια δολάρια.

Η κατανομή της παγκόσμιας αγοράς μεγάλων δεδομένων σχετικά με τις κατηγορίες των επιχειρήσεων θα μοιάζει με αυτό:

Όπως φαίνεται από το διάγραμμα, η πλειοψηφία της αγοράς θα καταλάβει την τεχνολογία από το πεδίο εφαρμογής της βελτίωσης της υπηρεσίας-πελάτη. Το μάρκετινγκ σημείων θα βρίσκεται σε δεύτερη προτεραιότητα στην εταιρεία μέχρι το 2019, το 2020, σύμφωνα με τη βαριά ανάγνωση, θα δώσει τη θέση τους σε λύσεις για τη βελτίωση της λειτουργικής αποτελεσματικότητας.
Ο υψηλότερος ρυθμός ανάπτυξης θα είναι επίσης στη "Βελτίωση του τμήματος υπηρεσίας πελάτη", η αύξηση είναι 49% ετησίως.
Η πρόβλεψη της αγοράς για μεγάλους υποτύπους δεδομένων θα μοιάζει με αυτό:

Το κυρίαρχο μερίδιο αγοράς, όπως φαίνεται από το διάγραμμα, η κατοχή επαγγελματικών υπηρεσιών, η αύξηση των υψηλότερων ποσοστών θα είναι σε εφαρμογές με αναλύσεις, το μερίδιό τους θα αυξηθεί από το σημερινό 12% έως 18% το 2020 και ο όγκος αυτού του τμήματος θα είναι Ίση με 12,3 δισεκατομμύρια δολάρια, το μερίδιο του υπολογιστικού εξοπλισμού, αντίθετα, θα μειωθεί από 20% σε 14% και θα έχει περίπου 9,3 δισεκατομμύρια δολάρια το 2020, η αγορά τεχνολογιών Cloud θα αυξηθεί σταδιακά και θα φτάσει τα 6,3 δισεκατομμύρια δολάρια, το μερίδιο της αγοράς λύσεων θα φτάσει τα 6,3 δισεκατομμύρια δολάρια. Η αποθήκευση δεδομένων, αντίθετα, θα μειωθεί από 15% το 2014 σε 13% το 2020 και σε νομισματικούς όρους θα είναι 8,9 δισεκατομμύρια δολάρια ΗΠΑ.
Σύμφωνα με την ανάλυση Bain & Company Insights, η μεγάλη διανομή αγοράς δεδομένων από τη βιομηχανία το 2020 θα μοιάζει με αυτό:

  • Η χρηματοπιστωτική βιομηχανία θα ασκήσει το κόστος των μεγάλων δεδομένων ύψους 6,4 δισεκατομμυρίων δολαρίων με μεσαίο ρυθμό αύξησης 22% ετησίως.
  • Οι εταιρείες του Διαδικτύου θα δαπανήσουν 2,8 δισεκατομμύρια δολάρια και ο μέσος ρυθμός αύξησης του κόστους θα είναι κατά 26% κατά τα επόμενα 5 χρόνια.
  • Το κόστος του δημόσιου τομέα θα είναι ανάλογες με το κόστος των εταιρειών Διαδικτύου, αλλά ο ρυθμός ανάπτυξης θα είναι χαμηλότερος - 22%.
  • Ο τομέας των τηλεπικοινωνιών θα αυξηθεί με μέσο ρυθμό αύξησης 40% και θα φθάσει τα 1,2 δισεκατομμύρια δολάρια το 2020 ·

Οι εταιρείες ενέργειας θα επενδύσουν σε αυτές τις τεχνολογίες ένα σχετικά μικρό ποσό - 800 εκατομμύρια δολάρια, αλλά ο ρυθμός ανάπτυξης θα είναι ένα από τα υψηλότερα - 54% ετησίως.
Έτσι, το μεγάλο μερίδιο της μεγάλης αγοράς δεδομένων το 2020 θα καταλάβει τη χρηματοπιστωτική βιομηχανία της εταιρείας και η ενέργεια θα είναι ο ταχύτερα αναπτυσσόμενος τομέας.
Μετά τις προβλέψεις των αναλυτών, ο συνολικός όγκος της αγοράς κατά τα προσεχή έτη θα αυξηθεί. Η ανάπτυξη της αγοράς θα εξασφαλιστεί με την εισαγωγή μεγάλης τεχνολογίας δεδομένων στις αναπτυσσόμενες χώρες του κόσμου, όπως φαίνεται από το παρακάτω πρόγραμμα.

Ο προβλεπόμενος όγκος της αγοράς θα εξαρτηθεί από τον τρόπο με τον οποίο οι αναπτυσσόμενες χώρες θα αντιληφθούν μεγάλες τεχνολογίες δεδομένων εάν είναι επίσης δημοφιλείς όπως στις ανεπτυγμένες χώρες. Το 2014, οι αναπτυσσόμενες χώρες του κόσμου κατέλαβαν το 40% του ποσού των συσσωρευμένων πληροφοριών. Σύμφωνα με την πρόβλεψη EMC, η τρέχουσα δομή της αγοράς, με την κυριαρχία των ανεπτυγμένων χωρών, θα αλλάξει ήδη το 2017. Σύμφωνα με τον αναλυτή EMC, το 2020, το μερίδιο των αναπτυσσόμενων χωρών θα υπερβαίνει το 60%.
Σύμφωνα με την Cisco και την EMC, οι αναπτυσσόμενες χώρες του κόσμου θα συνεργαστούν ενεργά με μεγάλα δεδομένα, από πολλές απόψεις θα συσχετιστούν με τη διαθεσιμότητα της τεχνολογίας και θα συσσωρευτούν επαρκείς πληροφορίες σε μεγάλα δεδομένα. Στο χάρτη του κόσμου που εκπροσωπείται στην επόμενη σελίδα, θα εμφανιστεί μια πρόβλεψη αύξησης του όγκου και του ρυθμού αύξησης των μεγάλων δεδομένων ανά περιοχή.

Ανάλυση της ρωσικής αγοράς

Τρέχουσα κατάσταση της ρωσικής αγοράς

Σύμφωνα με τα αποτελέσματα της μελέτης της CNEWS Analytics και της Oracle, το επίπεδο ωριμότητας της ρωσικής μεγάλης αγοράς δεδομένων έχει αυξηθεί κατά το παρελθόν έτος. Οι ερωτηθέντες που αντιπροσωπεύουν 108 μεγάλες επιχειρήσεις από διαφορετικές βιομηχανίες απέδειξαν υψηλότερο βαθμό συνειδητοποίησης αυτών των τεχνολογιών, καθώς και την τρέχουσα κατανόηση των δυνατοτήτων τέτοιων λύσεων για την επιχείρησή τους.
Από το 2014, σύμφωνα με την IDC, οι 155 πληροφορίες εκκρεμής έχουν συσσωρευτεί στη Ρωσία, η οποία είναι μόνο το 1,8% των παγκόσμιων δεδομένων. Το ποσό των πληροφοριών μέχρι το 2020 θα φθάσει το 980 exabyte και θα διαρκέσει 2,2%. Έτσι, ο μέσος ρυθμός αύξησης του ποσού των πληροφοριών θα είναι 36% ετησίως.
Η IDC αξιολογεί τη ρωσική αγορά στα 340 εκατομμύρια δολάρια, εκ των οποίων 100 εκατομμύρια δολάρια - SAP λύσεις, περίπου 240 εκατομμύρια δολάρια - παρόμοιες λύσεις Oracle, IBM, SAS, Microsoft κλπ.
Ο ρυθμός αύξησης της ρωσικής μεγαλύτερης αγοράς δεδομένων είναι τουλάχιστον 50% ετησίως.
Η διατήρηση της θετικής δυναμικής σε αυτόν τον τομέα της ρωσικής αγοράς πληροφορικής προβλέπεται, ακόμη και σε συνθήκες γενικής στασιμότητας της οικονομίας. Αυτό οφείλεται στο γεγονός ότι η επιχείρηση συνεχίζει να ζητήσει αποφάσεις για τη βελτίωση της αποτελεσματικότητας της εργασίας, καθώς και βελτιστοποίηση κόστους, βελτιώνοντας την ακρίβεια της πρόβλεψης και την ελαχιστοποίηση των πιθανών κινδύνων της εταιρείας.
Οι κύριοι πάροχοι υπηρεσιών στον τομέα των μεγάλων δεδομένων σχετικά με τη ρωσική αγορά είναι:
  • Μαντείο
  • Η Microsoft.
  • Cloudera.
  • Hortonworks.
  • Teradata.
Επισκόπηση της αγοράς από τη βιομηχανία και την εμπειρία στην εφαρμογή μεγάλων δεδομένων σε εταιρείες
Σύμφωνα με το CNEWS, στη Ρωσία, μόνο το 10% των εταιρειών άρχισε να χρησιμοποιεί μεγάλη τεχνολογία δεδομένων όταν στον κόσμο το μερίδιο των εταιρειών αυτών είναι περίπου 30%. Η ετοιμότητα για μεγάλα έργα δεδομένων αυξάνεται σε πολλούς τομείς της ρωσικής οικονομίας - που αποδεικνύεται από την έκθεση του CNEWS Analytics και της Oracle. Περισσότερο από το ένα τρίτο των εταιρειών που εξετάζονται (37%) άρχισαν να εργάζονται με μεγάλες τεχνολογίες δεδομένων, μεταξύ των οποίων το 20% χρησιμοποιεί ήδη τέτοιες λύσεις και το 17% αρχίζει να πειραματιστεί μαζί τους. Το δεύτερο τρίτο των ερωτηθέντων θεωρούν αυτή τη στιγμή μια τέτοια ευκαιρία.

Στη Ρωσία, πιο δημοφιλής με τη μεγάλη τεχνολογία δεδομένων χρησιμοποιείται στον τραπεζικό τομέα και την τηλεπικοινωνία, αλλά είναι επίσης σε ζήτηση στον τομέα της εξορυκτικής βιομηχανίας, της ενέργειας, της λιανικής, στις εταιρείες logistics και του δημόσιου τομέα.
Στη συνέχεια, θα ληφθούν υπόψη παραδείγματα εφαρμογής μεγάλων δεδομένων στις ρωσικές πραγματικότητες.

Τηλεπικοινωνία
Οι φορείς εκμετάλλευσης τηλεπικοινωνιών έχουν μία από τις πιο ογκώδεις βάσεις δεδομένων, οι οποίες τους επιτρέπει να πραγματοποιούν την πιο βαθιά ανάλυση των συσσωρευμένων πληροφοριών.
Μία από τις εφαρμογές της μεγάλης τεχνολογίας δεδομένων είναι να διαχειριστεί την πίστη των συνδρομητών.
Ο κύριος σκοπός της ανάλυσης δεδομένων είναι η κατοχή των υφιστάμενων πελατών και η προσέλκυση νέων. Για την εταιρεία αυτή, η κατάτμηση των πελατών, η ανάλυση της κυκλοφορίας τους, καθορίζει την κοινωνική ασφάλιση του συνδρομητή. Εκτός από τη χρήση πληροφοριών σε σκοπούς μάρκετινγκ, στις τηλεπικοινωνιακές τηλεπικοινωνίες χρησιμοποιούνται για την πρόληψη δόλων χρηματοπιστωτικών συναλλαγών.
Ένα από τα φωτεινά παραδείγματα αυτής της βιομηχανίας είναι ο Vimpelcom. Η εταιρεία εφαρμόζει μεγάλα δεδομένα για τη βελτίωση της ποιότητας των υπηρεσιών στο επίπεδο κάθε συνδρομητή, αναφοράς, ανάλυσης δεδομένων για την ανάπτυξη του δικτύου, την καταπολέμηση της ανεπιθύμητης αλληλογραφίας και την εξατομίκευση των υπηρεσιών.

Τράπεζες
Οι εμπειρογνώμονες από τη χρηματοπιστωτική βιομηχανία πραγματοποιούνται ένα σημαντικό ποσοστό των μεγάλων χρηστών δεδομένων. Ένα από τα επιτυχημένα πειράματα πραγματοποιήθηκε στην τράπεζα Ural για την ανασυγκρότηση και την ανάπτυξη, όπου η ενημερωτική βάση άρχισε να χρησιμοποιεί για να αναλύσει τους πελάτες, η τράπεζα άρχισε να προσφέρει εξειδικευμένες πίστωση, καταθέσεις και άλλες υπηρεσίες. Κατά τη διάρκεια της χρήσης αυτών των τεχνολογιών, το χαρτοφυλάκιο λιανικής δανείου της εταιρείας αυξήθηκε κατά 55%.
Μια Alpha Bank αναλύει πληροφορίες από τα κοινωνικά δίκτυα, τις εφαρμογές επεξεργασίας για ένα δάνειο, αναλύει τη συμπεριφορά των χρηστών της ιστοσελίδας της εταιρείας.
Η Sberbank άρχισε επίσης να επεξεργάζεται τη συστοιχία δεδομένων προκειμένου να καταδιώξει τους πελάτες, να αποτρέψουν δόλιες ενέργειες, διαχειριστές και διαχείριση κινδύνων. Στο μέλλον, σχεδιάζεται η βελτίωση της υπηρεσίας και η ανάλυση των ενεργειών των πελατών σε πραγματικό χρόνο.
Η Τράπεζα Περιφερειακής Ανάπτυξης της Ρωσίας αναλύει τη συμπεριφορά των ιδιοκτητών πλαστικών καρτών. Αυτό σας επιτρέπει να εντοπίσετε άτυπες λειτουργίες για έναν συγκεκριμένο πελάτη, αυξάνοντας έτσι την πιθανότητα ανίχνευσης κλοπής μετρητών με πλαστικές κάρτες.

Λιανεμποριο
Στη Ρωσία, η μεγάλη τεχνολογία δεδομένων εισήχθη από εταιρείες τόσο στο διαδίκτυο όσο και το εμπόριο εκτός σύνδεσης. Μέχρι σήμερα, σύμφωνα με το CNEWS Analytics, τα μεγάλα δεδομένα χρησιμοποιούν το 20% των λιανοπωλητών. Το 75% των ειδικών λιανικής θεωρούν τα μεγάλα δεδομένα που απαιτούνται για την ανάπτυξη μιας ανταγωνιστικής στρατηγικής προώθησης της εταιρείας. Σύμφωνα με τα στατιστικά στοιχεία της Hadoop, μετά την εισαγωγή μεγάλων τεχνολογιών δεδομένων, το κέρδος σε εμπορικές οργανώσεις αναπτύσσεται κατά 7-10%.
Οι ειδικοί M.Video μιλούν για τη βελτίωση του σχεδιασμού εφοδιαστικής μετά την εφαρμογή του SAP HANA, ως αποτέλεσμα της εφαρμογής της, η προετοιμασία της ετήσιας αναφοράς μειώθηκε από 10 ημέρες έως 3, ο ρυθμός του καθημερινού φορτίου δεδομένων μειώθηκε από 3 ώρες έως 30 λεπτά.
Wikimart Χρησιμοποιήστε την τεχνολογία δεδομένων για να σχηματίσουν συστάσεις στους επισκέπτες της ιστοσελίδας.
Ένα από τα πρώτα offline καταστήματα εισήγαγε την ανάλυση των μεγάλων δεδομένων στη Ρωσία ήταν "ταινία". Με τη βοήθεια μεγάλων δεδομένων, η λιανική άρχισε να μελετά πληροφορίες σχετικά με τους αγοραστές από επιταγές μετρητών. Ο έμπορος λιανικής πώλησης συλλέγει πληροφορίες για την κατάρτιση συμπεριφορικών μοντέλων, γεγονός που καθιστά δυνατή τη μεγαλύτερη αξιοποίηση αποφάσεων στο επίπεδο λειτουργικών και εμπορικών δραστηριοτήτων.

Βιομηχανία πετρελαίου και φυσικού αερίου
Σε αυτόν τον κλάδο, το πεδίο εφαρμογής της χρήσης μεγάλων δεδομένων είναι αρκετά ευρύ. Μεγάλη τεχνολογία δεδομένων μπορεί να εφαρμοστεί κατά τη διάρκεια της εξόρυξης ορυκτών από το υπέδαφος. Με τη βοήθειά τους, είναι δυνατόν να αναλυθεί η διαδικασία παραγωγής και των πιο αποτελεσματικών τρόπων εξαγόμενου, να παρακολουθήσουν τη διαδικασία γεώτρησης, την ανάλυση της ποιότητας των πρώτων υλών, καθώς και την επεξεργασία και την εμπορία των τελικών προϊόντων. Στη Ρωσία, αυτές οι τεχνολογίες έχουν ήδη γίνει transneft και rosneft.

Κρατικά όργανα
Σε χώρες όπως η Γερμανία, η Αυστραλία, η Ισπανία, η Ιαπωνία, η τεχνολογία της Βραζιλίας και του Πακιστάν, χρησιμοποιούνται για την επίλυση εθνικών ζητημάτων κλίμακας. Αυτές οι τεχνολογίες βοηθούν τις κυβερνητικές αρχές να παρέχουν πιο αποτελεσματικά υπηρεσίες στον πληθυσμό, να παρέχουν στοχοθετημένη κοινωνική στήριξη.
Στη Ρωσία, αυτές οι τεχνολογίες άρχισαν να αναπτύσσουν τέτοια κρατικά όργανα ως ταμείο συνταξιοδότησης, την ομοσπονδιακή φορολογική υπηρεσία και το υποχρεωτικό ταμείο ιατρικής ασφάλισης. Η δυνατότητα εφαρμογής έργων που χρησιμοποιούν μεγάλα δεδομένα είναι μεγάλη, αυτές οι τεχνολογίες θα μπορούσαν να συμβάλουν στη βελτίωση της ποιότητας των υπηρεσιών και, ως εκ τούτου, το βιοτικό επίπεδο του πληθυσμού.

Εφοδιαστική και μεταφορά
Τα μεγάλα δεδομένα μπορούν επίσης να χρησιμοποιηθούν από εταιρείες μεταφορών. Με τη βοήθεια μεγάλων τεχνολογιών δεδομένων, μπορείτε να παρακολουθείτε το πάρκινγκ, να λάβετε υπόψη το κόστος καυσίμων, να παρακολουθήσετε τις εφαρμογές των πελατών.
Οι σιδηρόδρομοι εισήγαγαν μεγάλες τεχνολογίες δεδομένων σε συνδυασμό με το SAP. Αυτές οι τεχνολογίες συνέβαλαν στη μείωση της περιόδου αναφοράς 43,5 φορές (από 14,5 ώρες σε 20 λεπτά), αυξήστε την ακρίβεια της κατανομής του κόστους 40 φορές. Επίσης, εισήχθησαν μεγάλα δεδομένα σχετικά με τις διαδικασίες σχεδιασμού και δασμολογικής ρύθμισης. Ολόκληρες οι εταιρείες χρησιμοποιούν περισσότερα από 300 συστήματα βασισμένα σε λύσεις SAP, συμμετέχουν 4 κέντρα δεδομένων και ο αριθμός των χρηστών ήταν 220.000.

Κύριοι οδηγοί και περιοριστές της αγοράς
Η ανάπτυξη μεγάλων τεχνολογιών δεδομένων στη ρωσική αγορά είναι:
  • Αυξημένο ενδιαφέρον από τους χρήστες στις δυνατότητες μεγάλων δεδομένων, ως μέθοδος αύξησης της ανταγωνιστικότητας της εταιρείας ·
  • Ανάπτυξη μεθόδων επεξεργασίας αρχείων πολυμέσων σε παγκόσμιο επίπεδο.
  • Μεταφορά διακομιστών επεξεργασίας προσωπικών πληροφοριών στο έδαφος της Ρωσίας, σύμφωνα με τον υιοθετημένο νόμο περί αποθήκευσης και επεξεργασίας προσωπικών δεδομένων.
  • Εφαρμογή του τομεακού σχεδίου για την αντικατάσταση εισαγωγής λογισμικού. Το σχέδιο αυτό περιλαμβάνει κρατική στήριξη για τους οικιακούς κατασκευαστές λογισμικού, καθώς και την παροχή προτιμήσεων των εγχώριων προϊόντων πληροφορικής στις προμήθειες για τον κρατικό λογαριασμό.
  • Στη νέα οικονομική κατάσταση, όταν το ποσοστό δολαρίου έχει αυξηθεί σχεδόν 2 φορές, μια τάση θα παρατηρηθεί με όλο και περισσότερη χρήση των φορέων υπηρεσιών ρωσικής υπηρεσίας, παρά ξένους.
  • Τη δημιουργία τεχνικών που προωθούν την ανάπτυξη της αγοράς τεχνολογίας των πληροφοριών, συμπεριλαμβανομένης της αγοράς μεγάλων δεδομένων ·
  • Κρατικό πρόγραμμα για την εισαγωγή συστημάτων δικτύου, η βάση για την οποία χρησιμοποιείται η τεχνολογία μεγάλων δεδομένων.

Τα κύρια εμπόδια στην ανάπτυξη μεγάλων δεδομένων στη ρωσική αγορά είναι:

  • Εξασφάλιση της ασφάλειας και της εμπιστευτικότητας των δεδομένων ·
  • Έλλειψη ειδικευμένου προσωπικού.
  • Ανεπάρκεια των συσσωρευμένων πόρων πληροφόρησης σε μεγάλα δεδομένα στις περισσότερες ρωσικές εταιρείες ·
  • Την πολυπλοκότητα της εισαγωγής νέων τεχνολογιών σε καθιερωμένα συστήματα πληροφοριών των εταιρειών ·
  • Το υψηλό κόστος των μεγάλων τεχνολογιών δεδομένων, η οποία οδηγεί σε περιορισμένο κύκλο επιχειρήσεων που έχουν τη δυνατότητα να εφαρμόσουν αυτές τις τεχνολογίες.
  • Πολιτική και οικονομική αβεβαιότητα που οδήγησαν στην εκροή κεφαλαίου και κατάψυξη επενδυτικών σχεδίων στη Ρωσία ·
  • Οι αυξανόμενες τιμές για τα εισαγόμενα προϊόντα και μια αύξηση του πληθωρισμού, σύμφωνα με την IDC, εμποδίζουν την ανάπτυξη ολόκληρης της αγοράς πληροφορικής.
Πρόβλεψη της ρωσικής αγοράς
Από σήμερα, η ρωσική μεγαλύτερη αγορά δεδομένων δεν είναι τόσο δημοφιλής όσο στις ανεπτυγμένες χώρες. Οι περισσότερες ρωσικές εταιρείες ενδιαφέρονται για αυτό, αλλά δεν λυθούν για να επωφεληθούν από τις δυνατότητές τους.
Παραδείγματα μεγάλων εταιρειών που έχουν ήδη επωφεληθεί από τη χρήση μεγάλων τεχνολογιών δεδομένων, επεκτείνουν την ευαισθητοποίηση αυτών των τεχνολογιών.
Οι αναλυτές διαθέτουν επίσης αισιόδοξες προβλέψεις σχετικά με τη ρωσική αγορά. Η IDC πιστεύει ότι το μερίδιο της ρωσικής αγοράς για τα επόμενα 5 χρόνια θα αυξηθεί, σε αντίθεση με τη γερμανική αγορά και την Ιαπωνία.
Μέχρι το 2020, ο όγκος των μεγάλων δεδομένων Η Ρωσία θα αυξηθεί από το σημερινό 1,8% έως το 2,2% του παγκόσμιου όγκου δεδομένων. Το ποσό των πληροφοριών θα αυξηθεί, σύμφωνα με το EMC, από το τρέχον 155 exabyte έως 980 exbaytes το 2020.
Προς το παρόν, η συσσώρευση πληροφοριών στο επίπεδο των μεγάλων δεδομένων συνεχίζεται στη Ρωσία.
Σύμφωνα με τη δημοσκόπηση της CNEWS Analytics, το 44% των ερωτηθέντων εταιρειών εργάζονται χωρίς περισσότερα από 100 Terabytes * και μόνο το 13% εργάζεται με όγκους άνω των 500 terabytes.

Παρ 'όλα αυτά, η ρωσική αγορά, ακολουθώντας τις παγκόσμιες τάσεις, θα αυξηθεί. Από το 2014, η αγορά IDC εκτιμάται σε 340 εκατομμύρια δολάρια.
Ο ρυθμός αύξησης της αγοράς για τα προηγούμενα έτη ήταν 50% ετησίως εάν παραμείνει στο ίδιο επίπεδο, τότε το 2018 ο όγκος της αγοράς θα φθάσει τα 1,7 δισεκατομμύρια δολάρια. Το μερίδιο της ρωσικής αγοράς στον κόσμο θα είναι περίπου 3%, το οποίο αυξήθηκε από το σημερινό 1,2%.

Τα πιο δεκτικά κλαδιά στη χρήση μεγάλων δεδομένων στη Ρωσία περιλαμβάνουν:

  • Λιανική και τράπεζες, γι 'αυτούς, κυρίως σημαντική ανάλυση της βάσης πελατών, αξιολογώντας την επίδραση των εκστρατειών μάρκετινγκ.
  • Τηλεπικοινωνίες - Τμηματοποίηση της βάσης πελατών και της δημιουργίας κυκλοφορίας.
  • Gossector - Αναφορά, ανάλυση αιτήσεων από τον πληθυσμό κ.λπ.
  • Εταιρείες πετρελαίου - Παρακολούθηση της εργασίας και ο σχεδιασμός της παραγωγής και των πωλήσεων.
  • Οι εταιρείες ενέργειας είναι η δημιουργία ευφυών συστημάτων ηλεκτρικής ενέργειας, επιχειρησιακής παρακολούθησης και πρόβλεψης.
Στις ανεπτυγμένες χώρες, τα μεγάλα δεδομένα ήταν ευρέως διαδεδομένα στους τομείς της υγείας, της ασφάλισης, της μεταλλουργίας, των εταιρειών στο Διαδίκτυο και τις μεταποιητικές επιχειρήσεις, πιθανότατα στο εγγύς μέλλον, οι ρωσικές εταιρείες από αυτές τις περιοχές θα εκτιμήσουν επίσης την επίδραση της εφαρμογής μεγάλων δεδομένων και θα προσαρμόσουν αυτές τις τεχνολογίες στις βιομηχανίες τους.
Στη Ρωσία, καθώς και στον κόσμο, θα παρατηρηθεί μια τάση στο εγγύς μέλλον για την απεικόνιση των δεδομένων, της ανάλυσης των αρχείων πολυμέσων και την ανάπτυξη του Διαδικτύου των πραγμάτων.
Παρά τη συνολική στασιμότητα της οικονομίας, τα προσεχή έτη, οι αναλυτές προβλέπουν περαιτέρω αύξηση της μεγάλης αγοράς δεδομένων, κυρίως οφείλεται στο γεγονός ότι η χρήση μεγάλων τεχνολογιών δεδομένων παρέχει ανταγωνιστικό πλεονέκτημα στους χρήστες της όσον αφορά τη βελτίωση της επιχειρηματικής αποδοτικότητας , προσελκύοντας πρόσθετες ροές πελατών, ελαχιστοποιώντας τους κινδύνους και την ελαχιστοποίηση των τεχνολογιών πρόβλεψης δεδομένων εφαρμογής.
Έτσι, μπορεί να συναχθεί το συμπέρασμα ότι το μεγάλο τμήμα δεδομένων στη Ρωσία βρίσκεται στο στάδιο του σχηματισμού, αλλά η ζήτηση για αυτές τις τεχνολογίες αυξάνεται κάθε χρόνο.

Κύρια Αποτελέσματα Ανάλυση Αγοράς

Παγκόσμια αγορά
Στο τέλος του 2014, η μεγάλη αγορά δεδομένων χαρακτηρίζεται από τις ακόλουθες παραμέτρους:
  • Ο όγκος της αγοράς ανήλθε σε 28,5 δισ. Δολάρια, αύξηση 45% σε σχέση με το προηγούμενο έτος.
  • Τα περισσότερα από τα μεγάλα έσοδα της αγοράς δεδομένων ήταν υπηρεσίες εξυπηρέτησης, το μερίδιό τους ήταν ίσο με 40% σε συνολικά έσοδα.
  • Το 36% των εσόδων άσκησε αιτήσεις και αναλύσεις μεγάλων δεδομένων, 17% - εξοπλισμός υπολογιστών και τεχνολογία αποθήκευσης 15% -
  • Οι πλατφόρμες στη μνήμη, όπως η SAP, η Hana και η Oracle είναι πιο δημοφιλής για την επίλυση των προβλημάτων μεγάλων δεδομένων.
  • Το 125% αύξησε τον αριθμό των εταιρειών με εφαρμοσμένα έργα στον τομέα της μεγάλης διαχείρισης δεδομένων.
Η πρόβλεψη της αγοράς για τα επόμενα έτη έχει ως εξής:
  • Το 2015, ο όγκος της αγοράς θα φθάσει τα 38,4 δισεκατομμύρια δολάρια, το 2020 - 68,7 δισεκατομμύρια δολάρια ΗΠΑ.
  • Ο μέσος ρυθμός ανάπτυξης θα είναι ίσος με 16% ετησίως.
  • Το μέσο κόστος της εταιρείας σε μεγάλη τεχνολογία δεδομένων θα είναι 13,8 εκατομμύρια δολάρια για μεγάλες επιχειρήσεις και 1,6 εκατομμύρια δολάρια για τις μικρές και μεσαίες επιχειρήσεις.
  • Οι τεχνολογίες θα έχουν τη μεγαλύτερη επικράτηση στις σφαίρες της υπηρεσίας πελατών και το μάρκετινγκ σημείων.
  • Το 2017, η παγκόσμια δομή της αγοράς θα αλλάξει προς την επικράτηση των εταιρειών χρηστών από τις αναπτυσσόμενες χώρες.
Ρωσική αγορά
Η ρωσική μεγαλύτερη αγορά δεδομένων βρίσκεται στο στάδιο του σχηματισμού, τα αποτελέσματα του 2014 μοιάζουν με αυτό:
  • Ο όγκος της αγοράς έφθασε 340 εκατομμύρια δολάρια.
  • Ο μέσος ρυθμός αύξησης της αγοράς τα προηγούμενα έτη ανήλθε σε 50% ετησίως.
  • Το συνολικό ποσό των συσσωρευμένων πληροφοριών ανήλθε σε 155 exabytes.
  • Το 10% των ρωσικών εταιρειών άρχισε να χρησιμοποιεί μεγάλη τεχνολογία δεδομένων.
  • Περισσότερη δημοφιλής τεχνολογία μεγάλων δεδομένων που απολαμβάνουν στον τραπεζικό τομέα, τις τηλεπικοινωνίες, τις εταιρείες στο Διαδίκτυο και το λιανικό εμπόριο.
Η πρόβλεψη της ρωσικής αγοράς για τα επόμενα χρόνια έχει ως εξής:
  • Ο όγκος της ρωσικής αγοράς το 2015 θα φτάσει τα 500 εκατομμύρια δολάρια, και το 2018 - 1,7 δισεκατομμύρια δολάρια ΗΠΑ.
  • Το μερίδιο της ρωσικής αγοράς στον κόσμο θα είναι περίπου 3% το 2018.
  • Ο αριθμός των συσσωρευμένων δεδομένων το 2020 θα είναι 980 exabytes.
  • Το ποσό των δεδομένων θα αυξηθεί στο 2,2% των παγκόσμιων δεδομένων των δεδομένων το 2020.
  • Η μεγαλύτερη δημοτικότητα θα αποκτήσει τεχνολογίες απεικόνισης δεδομένων, την ανάλυση των αρχείων πολυμέσων και το διαδίκτυο των πραγμάτων.
Σύμφωνα με τα αποτελέσματα της ανάλυσης, μπορεί να συναχθεί το συμπέρασμα ότι η μεγάλη αγορά δεδομένων εξακολουθεί να βρίσκεται στα αρχικά στάδια ανάπτυξης και στο εγγύς μέλλον θα παρατηρήσουμε την ανάπτυξή της και να επεκτείνουμε τις δυνατότητες αυτών των τεχνολογιών.

Σας ευχαριστούμε που αφιερώσατε το χρόνο να διαβάσετε αυτή τη χύδην εργασία, να εγγραφείτε στο blog μας - υπόσχονται πολλές νέες ενδιαφέρουσες δημοσιεύσεις!

Στήλη των εκπαιδευτικών NSU HSE για τους μύθους και τις περιπτώσεις εργασίας με μεγάλα δεδομένα

Σε σελιδοδείκτες

Οι εκπαιδευτικοί της Σχολής Νέων ΜΜΕ HSE HSE KONSTANTIN ROMANOV και ο Αλέξανδρος Πιατιγόρκι, ο οποίος είναι επίσης διευθυντής του ψηφιακού μετασχηματισμού του Bilain, έγραψε μια στήλη σε μεγάλες παρανοήσεις σχετικά με μεγάλα δεδομένα - παραδείγματα χρήσης της τεχνολογίας και των εργαλείων. Οι συγγραφείς δείχνουν ότι η δημοσίευση θα βοηθήσει τους διαχειριστές να κατανοήσουν αυτή την έννοια.

Μύθοι και παρανοήσεις για μεγάλα δεδομένα

Τα μεγάλα δεδομένα δεν είναι μάρκετινγκ

Ο όρος μεγάλα δεδομένα έγινε πολύ μοντέρνα - χρησιμοποιείται σε εκατομμύρια καταστάσεις και σε εκατοντάδες διαφορετικές ερμηνείες, συχνά δεν σχετίζονται με το τι είναι. Συχνά στα κεφάλια των ανθρώπων υπάρχει μια υποκατάσταση των εννοιών και τα μεγάλα δεδομένα συγχέονται με ένα προϊόν μάρκετινγκ. Επιπλέον, σε ορισμένες εταιρείες τα μεγάλα δεδομένα αποτελούν μέρος της μονάδας μάρκετινγκ. Το αποτέλεσμα της ανάλυσης μεγάλων δεδομένων μπορεί πράγματι να αποτελέσει πηγή δραστηριότητας μάρκετινγκ, αλλά όχι πια. Ας δούμε πώς λειτουργεί.

Εάν έχουμε εντοπίσει μια λίστα με εκείνους που αγόρασαν αγαθά στο κατάστημά μας περισσότερο από τρεις χιλιάδες ρούβλια πριν από δύο μήνες και στη συνέχεια έστειλαν κάποιες προτάσεις σε αυτούς τους χρήστες, τότε αυτό είναι τυπικό μάρκετινγκ. Αντιμετωπίζουμε ένα σαφές πρότυπο διαρθρωτικών δεδομένων και το χρησιμοποιούμε για να αυξήσουμε τις πωλήσεις.

Ωστόσο, αν συνδέσουμε τα δεδομένα CRM με πληροφορίες συνεχούς ροής, για παράδειγμα, από το Instagram, και την αναλύσουμε, θα βρούμε ένα πρότυπο: ένα άτομο που έχει μειώσει τη δραστηριότητά της την Τετάρτη το βράδυ και των οποίων οι τελευταίες φωτογραφίες απεικονίζονται από τα γατάκια, θα πρέπει να γίνει. Αυτό θα είναι ήδη μεγάλα δεδομένα. Βρήκαμε την ενεργοποίηση, το μεταφέρθηκε στους εμπόρους και το χρησιμοποίησαν για δικούς τους σκοπούς.

Από αυτό προκύπτει ότι η τεχνολογία συνήθως λειτουργεί με αδόμητα δεδομένα και εάν τα δεδομένα είναι δομημένα, το σύστημα εξακολουθεί να συνεχίζει να αναζητά κρυμμένα πρότυπα σε αυτά, πράγμα που δεν κάνει το μάρκετινγκ.

Τα μεγάλα δεδομένα δεν είναι αυτά

Το δεύτερο άκρο αυτής της ιστορίας: Τα μεγάλα δεδομένα συχνά συγχέονται με αυτό. Αυτό οφείλεται στο γεγονός ότι Ρωσικές εταιρείεςΚατά κανόνα, είναι επαγγελματίες που είναι οδηγοί όλων των τεχνολογιών, συμπεριλαμβανομένων των μεγάλων δεδομένων. Επομένως, αν συμβαίνουν όλα σε αυτό το τμήμα, για την εταιρεία στο σύνολό της, φαίνεται ότι πρόκειται για κάποιες δραστηριότητες πληροφορικής.

Στην πραγματικότητα, υπάρχει μια ριζική διαφορά: τα μεγάλα δεδομένα είναι μια δραστηριότητα που αποσκοπεί στην απόκτηση ενός συγκεκριμένου προϊόντος, το οποίο δεν ισχύει για αυτό, αν και χωρίς να υπάρχει τεχνολογία.

Μεγάλα δεδομένα - όχι πάντα τη συλλογή και ανάλυση των πληροφοριών

Υπάρχει μια άλλη παρανόηση σε σχέση με τα μεγάλα δεδομένα. Όλοι κατανοούν ότι αυτή η τεχνολογία συνδέεται με μεγάλες ποσότητες δεδομένων, αλλά τι είδους δεδομένα εννοείται, δεν είναι πάντοτε σαφές. Όλοι μπορούν να συλλέξουν και να χρησιμοποιήσουν πληροφορίες, τώρα είναι πιθανό όχι μόνο στις ταινίες, αλλά και σε οποιαδήποτε, ακόμη και μια πολύ μικρή εταιρεία. Η μόνη ερώτηση είναι ακριβώς τι να συλλέξετε και πώς να το χρησιμοποιήσετε με όφελος για τον εαυτό σας.

Αλλά θα πρέπει να γίνει κατανοητό ότι η μεγάλη τεχνολογία δεδομένων δεν θα είναι μια συλλογή και ανάλυση εντελώς καμία πληροφόρηση. Για παράδειγμα, εάν συγκεντρωθείτε σε κοινωνικά δίκτυα για ένα συγκεκριμένο άτομο, δεν θα είναι μεγάλα δεδομένα.

Τι είναι τα μεγάλα δεδομένα

Τα μεγάλα δεδομένα αποτελούνται από τρία στοιχεία:

  • δεδομένα;
  • analytics;
  • τεχνολογίες.

Τα μεγάλα δεδομένα δεν είναι ένα από αυτά τα συστατικά, αλλά ένα μάτσο και τα τρία στοιχεία. Συχνά οι άνθρωποι αντικαθιστούν τις έννοιες: κάποιος πιστεύει ότι τα μεγάλα δεδομένα είναι μόνο δεδομένα, κάποιος - αυτή η τεχνολογία. Αλλά στην πραγματικότητα, ανεξάρτητα από το πόσα δεδομένα έχετε συλλέξει, δεν θα κάνετε τίποτα μαζί τους χωρίς τις απαραίτητες τεχνολογίες και αναλύσεις. Εάν υπάρχει ένα καλό αναλυτικό, αλλά δεν υπάρχουν δεδομένα, τόσο πιο κακά.

Αν μιλάμε για δεδομένα, τότε αυτά δεν είναι μόνο κείμενα, αλλά και όλες οι φωτογραφίες που τοποθετούνται στο Instagram και γενικά, όλα όσα μπορούν να αναλυθούν και να χρησιμοποιηθούν για διαφορετικούς σκοπούς και εργασίες. Με άλλα λόγια, τα δεδομένα γίνονται κατανοητά από τεράστιες ποσότητες εσωτερικών και εξωτερικών δεδομένων διαφόρων δομών.

Χρειάζεστε επίσης έναν αναλυτή, επειδή το έργο των μεγάλων δεδομένων είναι να χτίσει κάποια πρότυπα. Δηλαδή, οι αναλύσεις είναι η ταυτοποίηση κρυφών εξαρτήσεων και η αναζήτηση νέων ερωτήσεων και απαντήσεων με βάση την ανάλυση ολόκληρου του όγκου των ετερογενών δεδομένων. Και τα μεγάλα δεδομένα θέτουν ερωτήσεις που βρίσκονται απευθείας από αυτήν την έξοδο δεδομένων.

Αν μιλάμε για τις εικόνες, τότε το γεγονός της τοποθέτησης της φωτογραφίας σας σε ένα μπλε μπλουζάκι δεν λέει τίποτα. Αλλά αν χρησιμοποιήσετε μια φωτογραφία για μεγάλο μοντέλο δεδομένων, μπορεί να βρεθεί ότι είναι τώρα που πρέπει να προσφέρετε ένα δάνειο, διότι στην κοινωνική σας ομάδα αυτή η συμπεριφορά δείχνει ένα συγκεκριμένο φαινόμενο σε δράσεις. Ως εκ τούτου, τα "γυμνά" δεδομένα χωρίς αναλύσεις, χωρίς την ανίχνευση κρυφών και μη προφανών εξαρτήσεων, τα μεγάλα δεδομένα δεν είναι.

Έτσι, έχουμε μεγάλα δεδομένα. Ο πίνακας τους είναι τεράστιος. Έχουμε επίσης έναν αναλυτή. Αλλά πώς να το κάνουμε αυτά τα ακατέργαστα δεδομένα, έχουμε μια συγκεκριμένη απόφαση; Για να το κάνετε αυτό, χρειαζόμαστε τεχνολογίες που τους επιτρέπουν να μην αποθηκεύονται μόνο (και πριν ήταν αδύνατο), αλλά και να αναλύσει.

Με απλά λόγια, εάν έχετε πολλά δεδομένα, θα χρειαστείτε τεχνολογίες, για παράδειγμα, το Hadoop, το οποίο καθιστά δυνατή την εξοικονόμηση όλων των πληροφοριών σε μια αρχική μορφή για μεταγενέστερη ανάλυση. Αυτός ο τύπος τεχνολογίας προέκυψε στους γίγαντες του Διαδικτύου, δεδομένου ότι ήταν οι πρώτοι που αντιμετωπίζουν το πρόβλημα της αποθήκευσης μιας μεγάλης σειράς δεδομένων και την ανάλυσή του για την επόμενη διάθεση.

Εκτός από τα εργαλεία για βελτιστοποιημένη και φθηνή αποθήκευση δεδομένων, απαιτούνται αναλυτικά όργανα, καθώς και πρόσθετο στην πλατφόρμα που χρησιμοποιείται. Για παράδειγμα, ένα ολόκληρο οικοσύστημα από τα σχετικά έργα και τεχνολογίες έχει ήδη διαμορφωθεί γύρω από το Hadoop. Εδώ είναι μερικά από αυτά:

  • Το χοίρο είναι μια δηλωτική γλώσσα ανάλυσης δεδομένων.
  • Ανάλυση δεδομένων - Ανάλυση δεδομένων χρησιμοποιώντας μια γλώσσα κοντά στο SQL.
  • Oozie - ροή εργασίας στο Hadoop.
  • Το HBase είναι μια βάση δεδομένων (μη σχεσιακή), ανάλογο του Google Big Table.
  • Mahout - Μαθησιακή μάθηση.
  • SQOOP - Μεταφορά δεδομένων από το RSCBD προς Hadoop και αντίστροφα.
  • Flume - Μεταφορά κορμών σε HDFs.
  • Zookeeper, Mrunit, Avro, Giraph, Ambari, Cassandra, Hcatalog, Fuse-DFS και ούτω καθεξής.

Όλα αυτά τα εργαλεία είναι διαθέσιμα σε όλους δωρεάν, αλλά υπάρχει ένα σύνολο πληρωμένων πρόσθετων.

Επιπλέον, οι ειδικοί χρειάζονται: Αυτός είναι ένας προγραμματιστής και αναλυτής (ο λεγόμενος επιστήμονας δεδομένων). Ένας διαχειριστής χρειάζεται επίσης να κατανοηθεί πώς εφαρμόζεται αυτός ο αναλυτής για την επίλυση συγκεκριμένου καθήκοντος, διότι από μόνο του είναι εντελώς νόημα αν δεν είναι ενσωματωμένο στις επιχειρηματικές διαδικασίες.

Και οι τρεις εργαζόμενοι πρέπει να εργάζονται σε μια ομάδα. Ένας διευθυντής που δίνει έναν ειδικό για την εργασία επιστημών δεδομένων για να βρει ένα συγκεκριμένο πρότυπο, θα πρέπει να καταλάβει ότι δεν είναι πάντα αυτό ακριβώς που χρειάζεται. Σε αυτή την περίπτωση, ο ηγέτης πρέπει να ακούσει προσεκτικά τι να βρεθεί ο επιστήμονας των δεδομένων, δεδομένου ότι συχνά τον βρίσκει να βρει πιο ενδιαφέρουσα και χρήσιμη για τις επιχειρήσεις. Ο στόχος σας είναι να το εφαρμόσετε στην επιχείρηση και να κάνετε ένα προϊόν από αυτό.

Παρά το γεγονός ότι τώρα υπάρχουν πολλοί διαφορετικοί τύποι μηχανών και τεχνολογιών, η τελική απόφαση παραμένει πάντα για ένα άτομο. Για αυτό, πρέπει να απεικονιστούν οι πληροφορίες. Εργαλεία για αυτό πολλά.

Το πιο ενδεικτικό παράδειγμα είναι οι γεωγραφικές αναλύσεις. Η Beeline λειτουργεί πολύ με τις κυβερνήσεις διαφόρων πόλεων και περιοχών. Πολύ συχνά, αυτές οι οργανώσεις παραγγέλλουν αναφορές τύπου "Μεταφορά μεταφορών σε καθορισμένο μέρος".

Είναι σαφές ότι μια τέτοια αναφορά θα πρέπει να φτάσει σε κυβερνητικές δομές σε μια απλή και κατανοητή μορφή. Εάν τους παρέχουμε ένα τεράστιο και εντελώς ακατανόητο τραπέζι (δηλαδή, οι πληροφορίες με τη μορφή στην οποία το έχουμε), είναι απίθανο να αγοράσουν μια τέτοια έκθεση - θα είναι εντελώς άχρηστο, δεν θα φέρουν αυτές τις γνώσεις ότι ήθελε να πάρει.

Επομένως, ανεξάρτητα από το πόσο καλά οι ειδικοί της επιστήμης των δεδομένων και τα όποια προτύπωση βρίσκουν, δεν θα μπορέσετε να συνεργαστείτε με αυτά τα δεδομένα χωρίς εργαλεία απεικόνισης υψηλής ποιότητας.

Πηγές δεδομένων

Η σειρά των ληφθέντων δεδομένων είναι πολύ μεγάλη, έτσι ώστε να μπορεί να χωριστεί σε ορισμένες ομάδες.

Εσωτερικές εταιρείες δεδομένων

Αν και αυτή η ομάδα περιλαμβάνει το 80% των συλλεγόμενων δεδομένων, αυτή η πηγή δεν χρησιμοποιείται πάντοτε. Συχνά αυτά είναι τα δεδομένα που απαιτούνται φαινομενικά από οποιονδήποτε γενικά, για παράδειγμα, τα αρχεία καταγραφής. Αλλά αν τους κοιτάξετε σε διαφορετική γωνία, μερικές φορές μπορείτε να βρείτε απροσδόκητα σχέδια.

Υπό όρους ελεύθερες πηγές

Αυτό περιλαμβάνει τα δεδομένα κοινωνικής δικτύωσης, το Διαδίκτυο και όλα όσα μπορείτε να διεισδύσετε. Γιατί είναι υπό όρους ελεύθερη; Από τη μία πλευρά, αυτά τα δεδομένα είναι διαθέσιμα σε όλους, αλλά αν είστε μια σημαντική εταιρεία, τότε τα βγάζετε στο μέγεθος της βάσης συνδρομητών σε δεκάδες χιλιάδες, εκατοντάδες ή εκατομμύρια πελατών - ήδη Δεν είναι εύκολο έργο. Ως εκ τούτου, στην αγορά πραγματοποιούνται υπηρεσίες καταβολής για την παροχή αυτών των δεδομένων.

Πηγές πληρωμένων

Αυτό περιλαμβάνει εταιρείες που πωλούν δεδομένα για χρήματα. Αυτά μπορούν να είναι τηλεπικοινωνιακά, εταιρείες DMP, Internet, γραφεία και συγκεντρωτές πιστωτικού ιστορικού και συγκεντρωτές. Στη Ρωσία, οι τηλεπικοινωνίες δεν πωλούν δεδομένα. Πρώτον, είναι οικονομικά ασύμφορη και, δεύτερον, απαγορεύεται από το νόμο. Ως εκ τούτου, πωλούν τα αποτελέσματα της επεξεργασίας τους, για παράδειγμα, γεωγραφικές αναλυτικές εκθέσεις.

Ανοίξτε τα δεδομένα

Το κράτος πηγαίνει να συναντήσει τις επιχειρήσεις και καθιστά δυνατή τη χρήση των δεδομένων που συλλέγουν. Σε μεγαλύτερο βαθμό, αναπτύσσεται στη Δύση, αλλά η Ρωσία σε αυτό το θέμα διατηρεί επίσης τις εποχές. Για παράδειγμα, υπάρχει μια πύλη ανοικτών δεδομένων της κυβέρνησης της Μόσχας, όπου οι πληροφορίες δημοσιεύονται σε διάφορα αντικείμενα αστικής υποδομής.

Για τους κατοίκους και τους επισκέπτες της Μόσχας, τα δεδομένα παρουσιάζονται σε τραπέζι και χαρτογραφική μορφή και για προγραμματιστές - σε ειδικές μορφές αναγνώσιμες από υπολογιστή. Ενώ το έργο λειτουργεί περιορισμένη λειτουργίαΑλλά αναπτύσσεται, που σημαίνει, είναι επίσης μια πηγή δεδομένων που μπορείτε να χρησιμοποιήσετε για τις επιχειρηματικές σας εργασίες.

Ερευνα

Όπως ήδη σημειώθηκε, το έργο των μεγάλων δεδομένων είναι να βρει ένα πρότυπο. Συχνά οι μελέτες που διεξάγονται σε όλο τον κόσμο μπορεί να αποτελέσουν σημείο υποστήριξης για την εξεύρεση κανονικότητας - μπορείτε να πάρετε ένα συγκεκριμένο αποτέλεσμα και να προσπαθήσετε να εφαρμόσετε παρόμοια λογική για τους δικούς σας σκοπούς.

Τα μεγάλα δεδομένα είναι μια περιοχή στην οποία δεν εργάζονται όλοι οι νόμοι των μαθηματικών. Για παράδειγμα, το "1" + 1 "δεν είναι" 2 ", αλλά πολλά άλλα, επειδή όταν η ανάμειξη πηγών δεδομένων μπορεί να αυξηθεί σημαντικά.

Παραδείγματα προϊόντων

Πολλοί είναι εξοικειωμένοι με την Spotify Music Selection Service. Είναι όμορφο στο ότι δεν ζητά από τους χρήστες που έχουν διάθεση σήμερα και το υπολογίζει με βάση τις πηγές που είναι διαθέσιμες σε αυτό. Γνωρίζει πάντα τι χρειάζεστε τώρα - τζαζ ή βαρύ βράχο. Αυτή είναι μια βασική διαφορά που τον παρέχει οπαδούς και διακρίνει από άλλες υπηρεσίες.

Τέτοια προϊόντα ονομάζονται αίσθημα-προϊόντα - όπως αισθάνονται τον πελάτη τους.

Η μεγάλη τεχνολογία δεδομένων χρησιμοποιείται στην αυτοκινητοβιομηχανία. Για παράδειγμα, κάνει tesla - στο δικό τους Τελευταίο μοντέλο Υπάρχει autopilot. Η εταιρεία επιδιώκει να δημιουργήσει ένα αυτοκίνητο που θα πάρει τον επιβάτη όπου χρειάζεται. Χωρίς μεγάλα δεδομένα είναι αδύνατο, διότι εάν χρησιμοποιούμε μόνο αυτά τα δεδομένα που παίρνετε απευθείας, καθώς ένα άτομο κάνει, τότε το αυτοκίνητο δεν θα είναι σε θέση να βελτιώσει.

Όταν οδηγούμε ένα αυτοκίνητο μόνοι σας, στη συνέχεια, με τη βοήθεια των νευρώνων μας, κάνουμε αποφάσεις που βασίζονται σε διάφορους παράγοντες που δεν παρατηρούμε καν. Για παράδειγμα, δεν μπορούμε να συνειδητοποιήσουμε γιατί αποφάσισαν να μην αέριο αμέσως στο πράσινο φως, και στη συνέχεια αποδεικνύεται ότι η λύση ήταν αλήθεια - το αυτοκίνητο σάρωσε πάνω σας στην τρελή ταχύτητα και δραπέτηκατε το ατύχημα.

Μπορείτε επίσης να δώσετε ένα παράδειγμα χρήσης μεγάλων δεδομένων στον αθλητισμό. Το 2002, ο Γενικός Διευθυντής της ομάδας μπέιζμπολ Oakland Athletics Billy Bean αποφάσισε να καταστρέψει το παράδειγμα του τρόπου εμφάνισης των αθλητών - επέλεξε και διδάσκει παίκτες "σε αριθμούς".

Συνήθως οι διαχειριστές εξετάζουν την επιτυχία των παικτών, αλλά σε αυτή την περίπτωση όλα ήταν διαφορετικά - για να πάρουν το αποτέλεσμα, ο διαχειριστής μελετήθηκε ποιες συνδυασμοί αθλητών χρειάζονταν, δίνοντας προσοχή σε μεμονωμένα χαρακτηριστικά. Επιπλέον, επέλεξε τους αθλητές που οι ίδιοι δεν φαντάσουν ένα μεγάλο δυναμικό, αλλά η ομάδα ως σύνολο αποδείχθηκε τόσο επιτυχημένη ότι κέρδισε είκοσι αγώνες στη σειρά.

Ο σκηνοθέτης Bennett Miller ακολούθησε στη συνέχεια την ταινία αφιερωμένη σε αυτή την ιστορία, "Το πρόσωπο που άλλαξε τα πάντα" στον κύριο ρόλο με τον Brad Pitt.

Η μεγάλη τεχνολογία δεδομένων είναι επίσης χρήσιμη στον χρηματοπιστωτικό τομέα. Κανείς στον κόσμο δεν μπορεί να καθορίσει ανεξάρτητα στον κόσμο, είτε να δώσει σε κάποιον σε κάποιον. Για να λάβετε μια απόφαση, εκτελείται βαθμολόγηση, δηλαδή, ένα πιθανοτικό μοντέλο είναι χτισμένο, το οποίο μπορεί να γίνει κατανοητό, θα επιστρέψει αυτό το άτομο ή όχι. Η βαθμολογία χρησιμοποιείται σε όλα τα στάδια: είναι δυνατόν, για παράδειγμα, να υπολογιστεί ότι ένα άτομο θα σταματήσει να πληρώνει σε ένα συγκεκριμένο σημείο.

Τα μεγάλα δεδομένα επιτρέπουν όχι μόνο να κερδίζουν χρήματα, αλλά και να τα σώσουν. Ειδικότερα, η τεχνολογία αυτή βοήθησε το γερμανικό Υπουργείο Εργασίας να μειώσει το κόστος των παροχών ανεργίας κατά 10 δισεκατομμύρια ευρώ, δεδομένου ότι μετά την ανάλυση των πληροφοριών κατέστη σαφές ότι το 20% των παροχών καταβλήθηκαν αχρεωστήτως.

Επίσης, οι τεχνολογίες χρησιμοποιούνται στην ιατρική (ειδικά αυτό είναι χαρακτηριστικό του Ισραήλ). Με μεγάλα δεδομένα, μπορείτε να βάλετε μια πολύ ακριβέστερη ανάλυση από ότι ένας γιατρός με τριάντα χρόνια θα κάνει.

Οποιοσδήποτε γιατρός όταν κάνει μια διάγνωση, βασίζεται μόνο σε αυτήν Δική της εμπειρία. Όταν το αυτοκίνητο αυτό, προέρχεται από την εμπειρία χιλιάδων από αυτούς τους γιατρούς και όλες τις υπάρχουσες ιστορίες ασθένειας. Λαμβάνει υπόψη το τι είναι το σπίτι του ασθενούς από την περιοχή, στην οποία η περιοχή ζει το θύμα, τι καπνός υπάρχει και ούτω καθεξής. Δηλαδή, λαμβάνει υπόψη τη μάζα των παραγόντων που οι γιατροί δεν λαμβάνουν υπόψη.

Ένα παράδειγμα χρήσης μεγάλων δεδομένων στην υγειονομική περίθαλψη μπορεί να ονομαστεί έργο έργου Artemis, το οποίο εισήγαγε ένα παιδικό νοσοκομείο του Τορόντο. Πρόκειται για ένα σύστημα πληροφοριών που συλλέγει και αναλύει τα δεδομένα σε πραγματικά μωρά σε πραγματικό χρόνο. Το μηχάνημα σας επιτρέπει να αναλύετε 1260 δείκτες υγείας κάθε παιδιού κάθε δευτερόλεπτο. Το έργο αυτό στοχεύει στην πρόβλεψη της ασταθής κατάστασης του παιδιού και την πρόληψη ασθενειών στα παιδιά.

Τα μεγάλα δεδομένα αρχίζουν να χρησιμοποιούνται στη Ρωσία: για παράδειγμα, το "Yandex" μπορεί να χρησιμοποιηθεί. Η Εταιρεία, μαζί με την Αστρασζιένταγια και τη ρωσική κοινωνία της κλινικής ογκολογίας, η Russco ξεκίνησε την πλατφόρμα ακτίνων που προορίζονται για γενετική και μοριακούς βιολόγους. Το έργο καθιστά δυνατή τη βελτίωση των μεθόδων διάγνωσης του καρκίνου και την ανίχνευση της προδιάθεσης στον καρκίνο. Η πλατφόρμα θα αρχίσει να εργάζεται τον Δεκέμβριο του 2016.

Συνεχίζοντας το θέμα:
συσκευές

Γνωρίστε το online παιχνίδι Invaders Galaxy (Galaxy Invaders) - η σύγχρονη εκδοχή του καλύτερου παιχνιδιού ρετρό του είδους του Space Invaders (Space Invaders). Αυτό είναι ένα παλιό καλό ...