diff options
author | Anton Luka Šijanec <anton@sijanec.eu> | 2023-02-12 23:52:05 +0100 |
---|---|---|
committer | Anton Luka Šijanec <anton@sijanec.eu> | 2023-02-12 23:52:05 +0100 |
commit | c6dae905f25fd76b47e346f17c31b71692eb2ae6 (patch) | |
tree | 43409cd8a3e9f028d96c7791fd14da7ec5af5052 /misc/analiza.txt | |
parent | JSON now by default again outputs nonascii values literally (diff) | |
download | travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.tar travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.tar.gz travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.tar.bz2 travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.tar.lz travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.tar.xz travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.tar.zst travnik-c6dae905f25fd76b47e346f17c31b71692eb2ae6.zip |
Diffstat (limited to 'misc/analiza.txt')
-rw-r--r-- | misc/analiza.txt | 38 |
1 files changed, 38 insertions, 0 deletions
diff --git a/misc/analiza.txt b/misc/analiza.txt index bb8b5f8..ca0f4f6 100644 --- a/misc/analiza.txt +++ b/misc/analiza.txt @@ -1 +1,39 @@ cd www; find .. -maxdepth 1 -name *.torrent | parallel ./insert.php 'mysql:host=tranzistor:3306\;dbname=travnik\;charset=utf8' travnik $TRAVNIK_DB_PASSWORD {} | tee ../tmp/insert.txt; ocd + +analizirati: +- kateri nestandardni ključi so v info slovarjih +- encodingi +- končnice datotek +- kategoriziranje po imenih torrentov in datotek +- število datotek -- percentile +- velikost torrenta -- percentile +- velikost torenta/število datotek -- percentile +- seznam največjih n torrentov in največjih n datotek +- filmi po letnicah -- percentile +- kodeki (iz imena; x265, x264, ...) +- resolucije (iz imena, 4K, 4K60fps, 720p) +- top n source +- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT?) +- ip naslovi + geoip +- odjemalci: verzije, popularnost v državi +- porti odjemalcev -- distribucija +- koliko % torrentov ima google -- sear.c + +citirati: +- bep +- parallel, r + +napisati: +- teorija DHT +- ostali projekti crawlanja DHTja +- program travnik in delovanje +- struktura podatkovne zbirke +- programi za analizo + +analiza za naprej, z novimi podatki: +- koliko časa so peeri živi po prvem videnju - percentile + glede na državo +- koliko časa po DL metadata imajo peeri še vedno metadata - percentile + glede na državo + glede na torrent +- število peerov v swarmu torrentov skozi čas (PeX -- treba implementat uTP in TCP) +- torrenti z največjimi swarmi +- kako hitro peeri nalagajo/bandwidth glede na has_pieces - percentile + glede na državo + glede na torrent +- a obstaja kak LPD na T-2 /16 mreži? |