to nie ’ teraz dzień Big data..”historia, która dała początek epoce dużych zbiorów danych, ale” dawno temu … ” ludzie zaczęli zbierać informacje za pomocą ręcznych ankiet, stron internetowych, czujników, plików i innych metod zbierania danych. Obejmuje to nawet organizacje międzynarodowe, takie jak WHO, ONZ, które zebrały na arenie międzynarodowej wszystkie możliwe zestawy informacji do monitorowania i śledzenia działań nie tylko związanych z ludźmi, ale także roślinnością i gatunkami zwierząt, aby podejmować ważne decyzje i wdrażać wymagane działania.
tak duże międzynarodowe korporacje, zwłaszcza firmy ecommerce i marketingowe, zaczęły wykorzystywać tę samą strategię do śledzenia i monitorowania działań klientów w celu promowania marek i produktów, co dało początek branży analitycznej. Teraz nie będzie nasycać się tak łatwo, jak firmy zdały sobie sprawę z prawdziwej wartości danych do podejmowania kluczowych decyzji w każdej fazie projektu Od początku do końca, aby stworzyć najlepsze zoptymalizowane rozwiązania pod względem kosztów, ilości, rynku, zasobów i ulepszeń.
V dużych danych to objętość, prędkość, różnorodność, prawdziwość, wartość i wartość, a każdy z nich wpływa na gromadzenie, monitorowanie, przechowywanie, analizę i raportowanie danych. Ekosystem pod względem graczy technologicznych systemu big data jest jak widać poniżej.
teraz omówię każdą technologię jeden po drugim, aby dać wgląd w to, co ważne komponenty i interfejsy.
Jak wyodrębnić dane z danych mediów społecznościowych z Facebooka, Twittera i linkedin do prostego pliku csv do dalszego przetwarzania.
aby móc wyodrębnić dane z Facebooka za pomocą kodu Pythona, musisz zarejestrować się jako programista na Facebooku, a następnie mieć token dostępu. Oto kroki do niego.
1. Przejdź do linku developers.facebook.com, Utwórz tam konto.
2. Przejdź do linku developers.facebook.com/tools/explorer.
3. Przejdź do listy rozwijanej” moje aplikacje „w prawym górnym rogu i wybierz”Dodaj nową aplikację”. Wybierz wyświetlaną nazwę i kategorię, a następnie „Utwórz identyfikator aplikacji”.
4. Ponownie wróć do tego samego linku developers.facebook.com/tools/explorer.zobaczysz „Graph API Explorer” poniżej „Moje aplikacje” w prawym górnym rogu. Z listy rozwijanej” Graph API Explorer ” wybierz aplikację.
5. Następnie wybierz „Pobierz Token”. Z tej listy rozwijanej wybierz „Uzyskaj Token dostępu użytkownika”. Wybierz uprawnienia z menu, które się pojawi, a następnie wybierz ” Uzyskaj Token dostępu.”
6. Przejdź do linku developers.facebook.com/tools/accesstoken. Wybierz „Debug” odpowiadający „Token użytkownika”. Przejdź do „Rozszerz dostęp do tokenów”. Dzięki temu twój token nie wygaśnie co dwie godziny.
Kod Pythona, aby uzyskać dostęp do publicznych danych Facebooka:
przejdź do linku https://developers.facebook.com/docs/graph-api, jeśli chcesz zebrać dane na temat wszystkiego, co jest publicznie dostępne. Zobacz https://developers.facebook.com/docs/graph-api /reference/v2.7/. Z tej dokumentacji Wybierz dowolne pole, z którego chcesz wyodrębnić dane, takie jak „grupy” lub „strony” itp. Przejdź do przykładów kodów Po wybraniu tych, a następnie wybierz „Facebook graph api”, a otrzymasz wskazówki, jak wyodrębnić informacje. Ten blog jest przede wszystkim na pobieranie danych zdarzeń.
Po pierwsze, Importuj 'urllib3′, 'facebook’, 'requests’, jeśli są już dostępne. Jeśli nie, pobierz te biblioteki. Zdefiniuj Token zmiennej i ustaw jego wartość na to, co masz powyżej jako „Token dostępu użytkownika”.