Prosty sposób na pobranie statystyk odnośnie sieci Steem - SteemSQL z poziomu przeglądarki
Wstęp
Istnieje kilka sposobów na pobieranie danych odnośnie sieci Steem, a jednym z nich jest publicznie dostępny serwer SQL autorstwa @arcange: https://steemit.com/steemit/@arcange/steemsql-com-a-public-sql-server-database-with-all-steemit-blockchain-data
Korzystanie z tego serwera wymaga jednak instalacji dodatkowego oprogramowania, co nieco zwiększa "próg wejścia". Jakiś czas temu trafiłem na wrapper SteemSQL, który umożliwia korzystanie z niego z poziomu przeglądarki. Autorem jest @emptyname: https://steemit.com/utopian-io/@emptyname/steemsql-wrapper-analyze-any-steemit-data-right-in-your-browser-with-one-click
Na stronie głównej: https://sql.steemhelpers.com/ mamy do dyspozycji okno do wprowadzania zapytania SQL oraz kilka przykładowych zapytań - więc nawet jeśli ktoś nie miał wcześniej do czynienia z SQL może spróbować przerabiać te gotowe, aby uzyskać dane, które go interesują.
Sprawdźmy zatem jak to wygląda w praktyce.
10 postów z największą liczbą głosów z taga #polish od 01.12.2017 do 27.12.2017 (dnia dzisiejszego)
SELECT TOP 10
author, net_votes, url
FROM Comments
WHERE depth=0 AND
category ='polish' AND
created >= '2017/12/01' AND
created <= '2017/12/27'
ORDER BY net_votes DESC
Liczba postów dziennie w tagu #tematygodnia od 01.12.2017 do 27.12.2017
SELECT CONVERT(DATE, created) as Date, COUNT(*) as Posts
FROM Comments
WHERE depth=0 AND
json_metadata LIKE '%"tematygodnia"%' AND
created >= '2017/12/01' AND
created <= '2017/12/27'
GROUP BY CONVERT(DATE, created)
ORDER BY CONVERT(DATE, created) DESC
Data | Liczba postów |
---|---|
2017-12-25 | 3 |
2017-12-24 | 4 |
2017-12-23 | 3 |
2017-12-22 | 2 |
2017-12-21 | 5 |
2017-12-20 | 5 |
2017-12-19 | 7 |
2017-12-18 | 4 |
2017-12-17 | 4 |
2017-12-16 | 4 |
2017-12-15 | 5 |
2017-12-14 | 3 |
2017-12-13 | 11 |
2017-12-12 | 5 |
2017-12-11 | 4 |
2017-12-10 | 8 |
2017-12-09 | 2 |
2017-12-08 | 3 |
2017-12-07 | 3 |
2017-12-06 | 1 |
2017-12-05 | 3 |
2017-12-04 | 3 |
2017-12-03 | 2 |
2017-12-02 | 2 |
2017-12-01 | 1 |
20 postów z taga #pl-artykuly z największą liczbą komentarzy od 01.12.2017 do 27.12.2017
SELECT TOP 20
author, children, url
FROM Comments
WHERE depth=0 AND
json_metadata LIKE '%"pl-artykuly"%' AND
created >= '2017/12/01' AND
created <= '2017/12/27'
ORDER BY children DESC
Najczęściej używane tagi z prefiksem 'pl-' (jako główny tag)
SELECT category, COUNT(category) as [cnt]
FROM Comments
WHERE
depth=0 AND
category LIKE 'pl-%'
GROUP BY category
ORDER BY cnt DESC
Tag | Liczba postów |
---|---|
#pl-steemdash | 59 |
#pl-artykuly | 23 |
#pl-gamedev | 5 |
#pl-pl | 3 |
#pl-polish | 2 |
#pl-artykuly-gry | 2 |
#pl-bitcoin | 2 |
#pl-linux | 2 |
#pl-fotografia | 2 |
#pl-tutorial | 1 |
#pl-blog | 1 |
#pl-polityka | 1 |
#pl-retro | 1 |
Mała zmiana:
Wcześniej drugi i trzeci przykład dotyczyły innych tagów - #tematygodnia, #pl-artykuly, ale ze względu na to, że pod uwagę brany jest główny tag, zmieniłem na tag #polish, który najczęściej używany jest jako główny.
Przykłady zawierają już pierwotnie użyte tagi. Dziękuję @lukmarcus za pomoc w naprawieniu.
Przyda sie :)
Dobrze wiedzieć :) jednak zastawiam się, czy to na pewno bezbłędne? Dodawałam w grudniu post z tagiem pl-artykuły i miał znacznie więcej komentarzy niż część tu wymienionych. Może sprawdza się to tylko w odniesieniu do tagu głównego ?
Faktycznie, racja. W ostatnim przykładzie nawet dopisałem, że "jako główna kategoria", bo coś mi się nie zgadzały wyniki, ale nie zwróciłem uwagi, że we wcześniejszych jest to samo. Chyba sobie mało wdzięczne przykłady dobrałem jak na szybką prezentację. Zaraz spróbuję to naprawić :)
Najważniejsze, że pokazałeś sposób działania ;)
Wielkie dzięki za ten post. Chciałem ogarnąć temat polskich tagów, ale do tego potrzebna mi była ilość artykułów dla poszczególnych tagów które mają tag polish. Próbowałem z interface mongo, ale ze względu na to, że miałem mały kontakt z mongo nie byłem pewny ile czasu mi to zajmie. Teraz zadanie wydaje się łatwiejsze.
Dobra robota :)