20 changed files with 4 additions and 1094 deletions
--- a/.gitignore
+++ b/.gitignore
@ -1,5 +0,0 @@
-
-*.pyc
-.idea/*
-__pycache__/*
-.DS_Store
--- a/.gitmodules
+++ b/.gitmodules
@ -1,3 +1,3 @@
-[submodule "bookstack"]
-	path = bookstack
-	url = git@git.jacknet.io:sarah/bookstack.git
+[submodule "wiki_utils"]
+	path = wiki_utils
+	url = gitea@git.jacknet.io:sarah/wiki_utils.git
--- a/1
+++ b/1
@ -1 +0,0 @@
-Subproject commit 8f6e38cb337bcf51b0790f2db7001681ceb9338f
--- a/country-flags.csv
+++ b/country-flags.csv
@ -1,258 +0,0 @@
-Country,Flag
-Afghanistan,🇦🇫
-Åland Islands,🇦🇽
-Albania,🇦🇱
-Algeria,🇩🇿
-American Samoa,🇦🇸
-Andorra,🇦🇩
-Angola,🇦🇴
-Anguilla,🇦🇮
-Antarctica,🇦🇶
-Antigua and Barbuda,🇦🇬
-Argentina,🇦🇷
-Armenia,🇦🇲
-Aruba,🇦🇼
-Australia,🇦🇺
-Austria,🇦🇹
-Azerbaijan,🇦🇿
-Bahamas,🇧🇸
-Bahrain,🇧🇭
-Bangladesh,🇧🇩
-Barbados,🇧🇧
-Belarus,🇧🇾
-Belgium,🇧🇪
-Belize,🇧🇿
-Benin,🇧🇯
-Bermuda,🇧🇲
-Bhutan,🇧🇹
-Bolivia,🇧🇴
-"Bonaire, Sint Eustatius and Saba",🇧🇶
-Bosnia and Herzegovina,🇧🇦
-Botswana,🇧🇼
-Bouvet Island,🇧🇻
-Brazil,🇧🇷
-British Indian Ocean Territory,🇮🇴
-British Virgin Islands,🇻🇬
-Brunei Darussalamm,🇧🇳
-Bulgaria,🇧🇬
-Burkina Faso,🇧🇫
-Burma,🇲🇲
-Burundi,🇧🇮
-Cambodia,🇰🇭
-Cameroon,🇨🇲
-Canada,🇨🇦
-Cape Verde,🇨🇻
-Cayman Islands,🇰🇾
-Central African Republic,🇨🇫
-Chad,🇹🇩
-Chile,🇨🇱
-China,🇨🇳
-Christmas Island,🇨🇽
-Cocos (Keeling) Islands,🇨🇨
-Colombia,🇨🇴
-Comoros,🇰🇲
-Congo,🇨🇩
-Cook Islands,🇨🇰
-Costa Rica,🇨🇷
-Côte d'Ivoire,🇨🇮
-Croatia,🇭🇷
-Cuba,🇨🇺
-Cyprus,🇨🇾
-Czech Republic,🇨🇿
-Czechoslovakia,🇨🇿
-Democratic Republic of the Congo,🇨🇩
-Denmark,🇩🇰
-Djibouti,🇩🇯
-Dominica,🇩🇲
-Dominican Republic,🇩🇴
-East Germany,➡️🇩🇪
-Ecuador,🇪🇨
-Egypt,🇪🇬
-El Salvador,🇸🇻
-Equatorial Guinea,🇬🇶
-Eritrea,🇪🇷
-Estonia,🇪🇪
-Ethiopia,🇪🇹
-Falkland Islands,🇫🇰
-Faroe Islands,🇫🇴
-Federated States of Micronesia,🇫🇲
-Fiji,🇫🇯
-Finland,🇫🇮
-France,🇫🇷
-French Guiana,🇬🇫
-French Polynesia,🇵🇫
-French Southern Territories,🇹🇫
-Gabon,🇬🇦
-Gambia,🇬🇲
-Georgia,🇬🇪
-Germany,🇩🇪
-Ghana,🇬🇭
-Gibraltar,🇬🇮
-Greece,🇬🇷
-Greenland,🇬🇱
-Grenada,🇬🇩
-Guadeloupe,🇬🇵
-Guam,🇬🇺
-Guatemala,🇬🇹
-Guernsey,🇬🇬
-Guinea,🇬🇳
-Guinea-Bissau,🇬🇼
-Guyana,🇬🇾
-Haiti,🇭🇹
-Heard Island and McDonald Islands,🇭🇲
-Holy See (Vatican City State),🇻🇦
-Honduras,🇭🇳
-Hong Kong,🇭🇰
-Hungary,🇭🇺
-Iceland,🇮🇸
-India,🇮🇳
-Indonesia,🇮🇩
-Iran,🇮🇷
-Iraq,🇮🇶
-Ireland,🇮🇪
-Isle of Man,🇮🇲
-Israel,🇮🇱
-Italy,🇮🇹
-Jamaica,🇯🇲
-Japan,🇯🇵
-Jersey,🇯🇪
-Jordan,🇯🇴
-Kazakhstan,🇰🇿
-Kenya,🇰🇪
-Kiribati,🇰🇮
-Korea,🇰🇵🇰🇷
-Kosovo,🇽🇰
-Kuwait,🇰🇼
-Kyrgyzstan,🇰🇬
-Laos,🇱🇦
-Latvia,🇱🇻
-Lebanon,🇱🇧
-Lesotho,🇱🇸
-Liberia,🇱🇷
-Libya,🇱🇾
-Liechtenstein,🇱🇮
-Lithuania,🇱🇹
-Luxembourg,🇱🇺
-Macao,🇲🇴
-Madagascar,🇲🇬
-Malawi,🇲🇼
-Malaysia,🇲🇾
-Maldives,🇲🇻
-Mali,🇲🇱
-Malta,🇲🇹
-Marshall Islands,🇲🇭
-Martinique,🇲🇶
-Mauritania,🇲🇷
-Mauritius,🇲🇺
-Mayotte,🇾🇹
-Mexico,🇲🇽
-Moldova,🇲🇩
-Monaco,🇲🇨
-Mongolia,🇲🇳
-Montenegro,🇲🇪
-Montserrat,🇲🇸
-Morocco,🇲🇦
-Mozambique,🇲🇿
-Myanmar,🇲🇲
-Namibia,🇳🇦
-Nauru,🇳🇷
-Nepal,🇳🇵
-Netherlands,🇳🇱
-Netherlands Antilles,🇳🇱
-New Caledonia,🇳🇨
-New Zealand,🇳🇿
-Nicaragua,🇳🇮
-Niger,🇳🇪
-Nigeria,🇳🇬
-Niue,🇳🇺
-Norfolk Island,🇳🇫
-North Korea,🇰🇵
-North Vietnam,🇻🇳
-Northern Mariana Islands,🇲🇵
-Norway,🇳🇴
-Oman,🇴🇲
-Pakistan,🇵🇰
-Palau,🇵🇼
-Palestine,🇵🇸
-Palestinian Territory,🇵🇸
-Panama,🇵🇦
-Papua New Guinea,🇵🇬
-Paraguay,🇵🇾
-Peru,🇵🇪
-Philippines,🇵🇭
-Poland,🇵🇱
-Portugal,🇵🇹
-Pitcairn,🇵🇳
-Puerto Rico,🇵🇷
-Qatar,🇶🇦
-Republic of Macedonia,🇲🇰
-Réunion,🇷🇪
-Romania,🇷🇴
-Russia,🇷🇺
-Rwanda,🇷🇼
-Saint Barthélemy,🇧🇱
-Saint Helena,🇸🇭
-Saint Kitts and Nevis,🇰🇳
-Saint Lucia,🇱🇨
-Saint Martin (French part),🇫🇷
-Saint Pierre and Miquelon,🇵🇲
-Saint Vincent and the Grenadines,🇻🇨
-Samoa,🇼🇸
-San Marino,🇸🇲
-Sao Tome and Principe,🇸🇹
-Saudi Arabia,🇸🇦
-Senegal,🇸🇳
-Serbia,🇷🇸
-Serbia and Montenegro,🇷🇸🇲🇪
-Seychelles,🇸🇨
-Siam,🇹🇭
-Sierra Leone,🇸🇱
-Singapore,🇸🇬
-Slovakia,🇸🇰
-Slovenia,🇸🇮
-Solomon Islands,🇸🇧
-Somalia,🇸🇴
-South Africa,🇿🇦
-South Georgia and the South Sandwich Islands,🇬🇸
-South Korea,🇰🇷
-Spain,🇪🇸
-Sri Lanka,🇱🇰
-Sudan,🇸🇩
-Suriname,🇸🇷
-Svalbard and Jan Mayen,🇸🇯
-Swaziland,🇸🇿
-Sweden,🇸🇪
-Switzerland,🇨🇭
-Syria,🇸🇾
-Taiwan,🇹🇼
-Tajikistan,🇹🇯
-Tanzania,🇹🇿
-Thailand,🇹🇭
-Timor-Leste,🇹🇱
-Togo,🇹🇬
-Tokelau,🇹🇰
-Tonga,🇹🇴
-Trinidad and Tobago,🇹🇹
-Tunisia,🇹🇳
-Turkey,🇹🇷
-Turkmenistan,🇹🇲
-Turks and Caicos Islands,🇹🇨
-Tuvalu,🇹🇻
-U.S. Virgin Islands,🇻🇮
-Uganda,🇺🇬
-Ukraine,🇺🇦
-United Arab Emirates,🇦🇪
-United Kingdom,🇬🇧
-United States,🇺🇸
-United States Minor Outlying Islands,🇺🇲
-Uruguay,🇺🇾
-Uzbekistan,🇺🇿
-Vanuatu,🇻🇺
-Venezuela,🇻🇪
-Vietnam,🇻🇳
-Wallis and Futuna,🇫🇷
-West Germany,⬅️🇩🇪
-Western Sahara,🇪🇭
-Yemen,🇾🇪
-Zambia,🇿🇲
-Zimbabwe,🇿🇼
--- a/generate_map_timelapse.py
+++ b/generate_map_timelapse.py
@ -1,73 +0,0 @@
-from wiki_pages import FilmsByCountry
-from vcinema_utils import VCinemaUtils
-
-import argparse
-from collections import OrderedDict
-import imageio
-from progress.bar import IncrementalBar
-from pygifsicle import optimize
-from PIL import Image, ImageFont, ImageDraw, ImageFont
-import io
-
-
-def generate_map_timelapse(token_id, token_secret, filename):
-    print("Getting viewings")
-    viewings = VCinemaUtils.get_vcinema_viewings(token_id, token_secret, combine_repeat_viewings=False)
-
-    viewing_count = len(viewings)
-    with IncrementalBar('Retrieving movie data', max=viewing_count, suffix='%(percent).1f%% - %(eta)ds remaining', check_tty=False) as bar:
-        VCinemaUtils.add_imdb_data_to_viewings(viewings, ['countries'], bar)
-
-    date_viewings = VCinemaUtils.filter_viewings(viewings, "date_watched")
-
-    date_viewings = OrderedDict(sorted(date_viewings.items(), key=lambda t: t[0]))
-
-    running_country_counts = {}
-    print(len(date_viewings.keys()))
-
-    with imageio.get_writer(filename, mode='I', duration=0.1) as writer:
-        for date, viewings in date_viewings.items():
-            date_viewings_countries = VCinemaUtils.filter_viewings(viewings, "countries")
-
-            for country in date_viewings_countries:
-                if country in running_country_counts.keys():
-                    running_country_counts[country] += date_viewings_countries[country]
-                else:
-                    running_country_counts[country] = date_viewings_countries[country]
-
-            map = FilmsByCountry.draw_map(running_country_counts, file_name="map-{}.svg".format(date))
-
-            stream = io.BytesIO(map)
-            img = Image.open(stream)
-
-            map_editable = ImageDraw.Draw(img)
-
-            # macos font path
-            font = ImageFont.truetype("/System/Library/Fonts/Supplemental/Arial.ttf", 48)
-
-            # image is 655 high
-            map_editable.text((2, 605), "{}".format(date), (255, 64, 0), font=font)
-
-            img_byte_arr = io.BytesIO()
-            img.save(img_byte_arr, format='PNG')
-            img_byte_arr = img_byte_arr.getvalue()
-
-            image = imageio.imread(img_byte_arr)
-            writer.append_data(image)
-
-    print("optimizing")
-
-    optimize(filename)
-
-    print("done")
-
-
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser(description='Create timelapse gif of vcinema countries')
-    parser.add_argument('token_id', help='API token ID.')
-    parser.add_argument('token_secret', help='API token secret.')
-    parser.add_argument('filename', help='Name of output gif')
-
-    args = parser.parse_args()
-
-    generate_map_timelapse(args.token_id, args.token_secret, args.filename)
--- a/get_hidden_themes.py
+++ b/get_hidden_themes.py
@ -1,33 +0,0 @@
-from imdb_utils import IMDbUtils
-
-import argparse
-from progress.bar import IncrementalBar
-
-
-def get_hidden_themes(imdb_ids):
-    film_keywords = []
-
-    with IncrementalBar('Retrieving movie data', max=len(imdb_ids), suffix='%(percent).1f%% - %(eta)ds remaining', check_tty=False) as bar:
-        for imdb_id in imdb_ids:
-            movie_data = IMDbUtils.get_movie_keywords(imdb_id)
-
-            if 'keywords' in movie_data:
-                keywords = set(movie_data['keywords'])
-                film_keywords.append(keywords)
-
-            bar.next()
-
-    hidden_themes = set.intersection(*film_keywords)
-
-    return hidden_themes
-
-
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser()
-    parser.add_argument('imdb_ids', nargs="+", default=[])
-
-    args = parser.parse_args()
-
-    hidden_themes = get_hidden_themes(args.imdb_ids)
-
-    print(hidden_themes)
--- a/imdb_utils/IMDbUtils.py
+++ b/imdb_utils/IMDbUtils.py
@ -1,60 +0,0 @@
-from imdb import IMDb
-import requests
-from bs4 import BeautifulSoup
-import re
-
-
-def get_movie(imdb_id):
-    ia = IMDb()
-
-    movie = ia.get_movie(imdb_id)
-
-    return movie
-
-
-def get_movie_keywords(imdb_id):
-    ia = IMDb()
-
-    movie = ia.get_movie(imdb_id, info="keywords")
-
-    return movie
-
-
-def get_api_keyword_count(keyword):
-    ia = IMDb()
-
-    count = len(ia.get_keyword(keyword))
-
-    return count
-
-
-def get_website_keyword_count(keyword):
-    try:
-        page = requests.get("https://www.imdb.com/search/keyword/?keywords=" + keyword)
-    except ConnectionError:
-        raise
-
-    soup = BeautifulSoup(page.content, 'html.parser')
-    elements = soup.findAll("div", class_="desc")
-
-    pagination_label = elements[0].text.replace("\n", "")
-
-    pagination_label_reg = "(\d+,?\d*) titles"
-    pattern_match = re.compile(pagination_label_reg).search(pagination_label)
-
-    if pattern_match is not None:
-        return int(pattern_match.group(1).replace(',', ''))
-    else:
-        return 1
-
-
-def get_keyword_count(keyword):
-    count = get_api_keyword_count(keyword)
-
-    if count == 50:
-        try:
-            count = get_website_keyword_count(keyword)
-        except Exception as e:
-            raise
-
-    return count
--- a/imdb_utils/init.py
+++ b/imdb_utils/init.py
--- a/update_viewings_csv.py
+++ b/update_viewings_csv.py
@ -1,16 +0,0 @@
-import json
-
-from wiki_pages import ViewingsCsv
-
-
-def update_viewings_csv(token_id, token_secret):
-    print("Updating CSV")
-    ViewingsCsv.update_viewings_csv(token_id, token_secret)
-    print("Done!")
-
-
-if __name__ == '__main__':
-    with open('token.json') as json_file:
-        token = json.load(json_file)
-
-    update_viewings_csv(token['token_id'], token['token_secret'])
--- a/update_wiki.py
+++ b/update_wiki.py
@ -1,69 +0,0 @@
-from wiki_pages import FilmsByCountry, FilmsByReference, FilmsByYear, HiddenThemes, KeywordScores, ViewingsCsv
-from vcinema_utils import VCinemaUtils
-
-import argparse
-import json
-from progress.bar import IncrementalBar
-
-
-def update_wiki(token_id, token_secret, update_csv, pages):
-    if update_csv:
-        print("Updating CSV")
-        ViewingsCsv.update_viewings_csv(token_id, token_secret)
-
-    print("Getting viewings")
-    viewings = VCinemaUtils.get_vcinema_viewings(token_id, token_secret)
-
-    update_films_by_year = 'years' in pages
-    update_films_by_country = 'countries' in pages
-    update_film_references = 'references' in pages
-    update_hidden_themes = 'themes' in pages
-    update_keyword_scores = 'scores' in pages
-
-    data_fields = []
-    if update_films_by_year:
-        data_fields.append("year")
-
-    if update_films_by_country:
-        data_fields.append("countries")
-
-    if update_film_references or update_hidden_themes or update_keyword_scores:
-        data_fields.append("keywords")
-
-    viewing_count = len(viewings)
-    with IncrementalBar('Retrieving movie data', max=viewing_count, suffix='%(percent).1f%% - %(eta)ds remaining', check_tty=False) as bar:
-        VCinemaUtils.add_imdb_data_to_viewings(viewings, data_fields, bar)
-
-    print("Processing viewing data")
-
-    if update_films_by_year:
-        films_by_year = FilmsByYear.get_films_by_year(viewings)
-        FilmsByYear.update_page(token_id, token_secret, films_by_year)
-    if update_films_by_country:
-        films_by_country = FilmsByCountry.get_films_by_country(viewings)
-        FilmsByCountry.update_page(token_id, token_secret, films_by_country)
-    if update_film_references:
-        films_by_reference = FilmsByReference.get_films_by_reference(viewings)
-        FilmsByReference.update_page(token_id, token_secret, films_by_reference)
-    if update_hidden_themes:
-        hidden_themes = HiddenThemes.get_hidden_themes(viewings, token_id, token_secret)
-        HiddenThemes.update_page(token_id, token_secret, hidden_themes)
-    if update_keyword_scores:
-        keyword_scores = KeywordScores.get_keyword_scores(viewings)
-        KeywordScores.update_page(token_id, token_secret, keyword_scores)
-
-    print("Done!")
-
-
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser(description='Update wiki pages.')
-
-    parser.add_argument('--pages', nargs="+", default=['years', 'countries', 'references', 'themes', 'scores'], required=False)
-    parser.add_argument("--do_not_update_csv", action="store_true")
-
-    args = parser.parse_args()
-
-    with open('token.json') as json_file:
-        token = json.load(json_file)
-
-    update_wiki(token['token_id'], token['token_secret'], not args.do_not_update_csv, args.pages)
--- a/vcinema_utils/VCinemaUtils.py
+++ b/vcinema_utils/VCinemaUtils.py
@ -1,150 +0,0 @@
-from collections import Counter
-from concurrent.futures import ThreadPoolExecutor
-import csv
-
-from imdb_utils import IMDbUtils
-from bookstack import Bookstack
-
-
-JACKNET_WIKI_URL = "https://wiki.jacknet.io"
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/csv
-CSV_PAGE_ID = 11
-
-
-def get_viewings_csv_attachment_id(token_id, token_secret):
-    attachments = Bookstack.get_attachments(JACKNET_WIKI_URL, token_id, token_secret)
-
-    viewings_csv_file_name = "vcinema.csv"
-
-    return next((x['id'] for x in attachments if x['uploaded_to'] == CSV_PAGE_ID and x['name'] == viewings_csv_file_name), None)
-
-
-def get_vcinema_viewings(token_id, token_secret, viewings_csv=None, combine_repeat_viewings=True):
-    if viewings_csv is None:
-        attachment_id = get_viewings_csv_attachment_id(token_id, token_secret)
-        viewings_csv = Bookstack.get_attachment(JACKNET_WIKI_URL, token_id, token_secret, attachment_id)
-
-    viewings_csv = viewings_csv.decode("utf-8")
-    viewings_csv_rows = viewings_csv.strip().split("\n")
-
-    viewings = list(csv.DictReader(viewings_csv_rows, quotechar='"'))
-
-    if combine_repeat_viewings:
-        for viewing in viewings:
-            viewing['viewings'] = [
-                {'date_watched': viewing['date_watched'], 'season': viewing['season'], 'rating': viewing['rating']}]
-            viewing.pop('date_watched')
-            viewing.pop('season')
-            viewing.pop('rating')
-
-        watch_counts = Counter([x['imdb_id'] for x in viewings])
-        repeat_watches = [k for k, v in watch_counts.items() if v > 1]
-
-        for film in repeat_watches:
-            viewing_indexes = [index for index, viewing in enumerate(viewings) if viewing['imdb_id'] == film]
-
-            first_watch = viewings[viewing_indexes[0]]
-
-            for index in viewing_indexes[1::]:
-                first_watch['viewings'].extend(viewings[index]['viewings'])
-
-            for index in reversed(viewing_indexes[1::]):
-                viewings.pop(index)
-
-    return viewings
-
-
-def add_imdb_data(imdb_id, viewings, data_fields, progressbar=None):
-    movie = IMDbUtils.get_movie(imdb_id)
-
-    for viewing in viewings:
-        if viewing['imdb_id'] == movie.movieID:
-            for field_name in data_fields:
-                if field_name in movie:
-                    viewing[field_name] = movie[field_name]
-
-    if progressbar is not None:
-        progressbar.next()
-
-
-def add_imdb_keywords(imdb_id, viewings, progressbar=None):
-    movie = IMDbUtils.get_movie_keywords(imdb_id)
-
-    for viewing in viewings:
-        if viewing['imdb_id'] == movie.movieID:
-            if 'keywords' in movie:
-                viewing['keywords'] = movie['keywords']
-
-    if progressbar is not None:
-        progressbar.next()
-
-
-def add_imdb_data_to_viewings(viewings, field_names, progress_bar=None):
-    with ThreadPoolExecutor(4) as executor:
-        future_imdb_tasks = set()
-
-        if ('keywords' in field_names and len(field_names) > 1) or ('keywords' not in field_names and len(field_names) > 0):
-            future_imdb_tasks.update(executor.submit(add_imdb_data, viewing['imdb_id'], viewings, field_names, progress_bar) for viewing in viewings)
-
-        if 'keywords' in field_names:
-            future_imdb_tasks.update(executor.submit(add_imdb_keywords, viewing['imdb_id'], viewings, progress_bar) for viewing in viewings)
-
-        progress_bar.max = len(future_imdb_tasks)
-
-    if progress_bar is not None:
-        progress_bar.finish()
-
-
-def filter_viewings(viewings, filter_field):
-    viewings_filtered = {}
-
-    for viewing in viewings:
-        if filter_field in viewing:
-            viewing_field = viewing[filter_field]
-            if isinstance(viewing_field, list):
-                for fve in list(viewing_field):
-                    if fve in viewings_filtered.keys():
-                        viewings_filtered[fve] += [viewing]
-                    else:
-                        viewings_filtered[fve] = [viewing]
-            else:
-                if viewing_field in viewings_filtered.keys():
-                    viewings_filtered[viewing_field] += [viewing]
-                else:
-                    viewings_filtered[viewing_field] = [viewing]
-
-    return viewings_filtered
-
-
-def get_film_list(films):
-    film_links = []
-
-    for film in films:
-        film_link = generate_imdb_film_link(film)
-        film_links.append(film_link)
-
-    if len(film_links) > 0:
-        return "<br>".join(film_links)
-    else:
-        return ""
-
-
-def generate_markdown_link(text, url):
-    return "[{}]({})".format(text, url)
-
-
-def generate_imdb_film_link(film):
-    return generate_markdown_link(film['title'], generate_imdb_url(film['imdb_id']))
-
-
-def generate_wikipedia_page_link(page_title):
-    return generate_markdown_link(page_title, generate_wikipedia_url(page_title))
-
-
-def generate_imdb_url(imdb_id):
-    return "https://www.imdb.com/title/tt{}/".format(imdb_id)
-
-
-def generate_wikipedia_url(page_title):
-    return "https://en.wikipedia.org/wiki/{}".format(page_title.replace(" ", "_"))
--- a/vcinema_utils/init.py
+++ b/vcinema_utils/init.py
--- a/wiki_pages/FilmsByCountry.py
+++ b/wiki_pages/FilmsByCountry.py
@ -1,104 +0,0 @@
-import base64
-from collections import Counter, OrderedDict
-import csv
-import os
-import pyvips
-import worldmap
-import warnings
-
-from bookstack import Bookstack
-from vcinema_utils import VCinemaUtils
-
-warnings.filterwarnings("ignore")
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/films-by-country
-PAGE_ID = 34
-
-
-def get_films_by_country(viewings):
-    viewings_filtered_by_country = VCinemaUtils.filter_viewings(viewings, "countries")
-
-    if "Czechia" in viewings_filtered_by_country.keys():
-        viewings_filtered_by_country["Czech Republic"] = viewings_filtered_by_country["Czechia"]
-        viewings_filtered_by_country.pop("Czechia")
-
-    return viewings_filtered_by_country
-
-
-def update_page(token_id, token_secret, films_by_country):
-    page = build_page(films_by_country)
-    Bookstack.update_page(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, PAGE_ID, markdown=page)
-
-
-def build_page(films_by_country):
-    table = build_table(films_by_country)
-
-    country_counter = Counter(films_by_country)
-    png_data = draw_map(country_counter)
-    encoded = base64.b64encode(png_data).decode("utf-8")
-    image = "![](data:image/png;base64,{})".format(encoded)
-    page = image + "\n" + table
-
-    return page
-
-
-def get_flags_dict():
-    flags = {}
-
-    with open('country-flags.csv', newline='') as f:
-        reader = csv.reader(f, quotechar="\"")
-        next(reader, None)  # skip the headers
-
-        for row in reader:
-            flags[row[0]] = row[1]
-
-    return flags
-
-
-def build_table(films_by_country):
-    films_by_country_sorted = OrderedDict(sorted(films_by_country.items(), key=lambda t: t[0]))
-
-    flags = get_flags_dict()
-
-    table = "| Country | Films |\n| - | - |"
-
-    for country, films in films_by_country_sorted.items():
-        table += "\n"
-
-        row_data = []
-
-        country_label = country
-        if country in flags.keys():
-            country_label += " "
-            country_label += flags[country]
-
-        row_data.append(country_label)
-        row_data.append(VCinemaUtils.get_film_list(films))
-
-        table += " | ".join(row_data)
-
-    return table
-
-
-def draw_map(films_by_country, file_name="vcinema_map.svg"):
-    films_by_country['Germany'] += films_by_country['West Germany']
-    del films_by_country['West Germany']
-
-    counter = Counter(films_by_country)
-    countries = [k for k, v in counter.items()]
-    counts = [len(v) for _, v in counter.items()]
-
-    max_count = max(counts)
-
-    opacity = [0.5 + (x / (float(max_count))/2.0) for x in counts]
-
-    worldmap.plot(countries, cmap=["#FF4000"], opacity=opacity, filename=file_name, verbose=False)
-
-    image = pyvips.Image.new_from_file(file_name)
-    image = image.thumbnail_image(1000, crop=pyvips.Interesting.ALL)
-
-    png_data = image.write_to_buffer(".png")
-
-    os.remove(file_name)
-
-    return png_data
--- a/wiki_pages/FilmsByReference.py
+++ b/wiki_pages/FilmsByReference.py
@ -1,100 +0,0 @@
-from collections import OrderedDict
-import wikipedia
-
-from bookstack import Bookstack
-from vcinema_utils import VCinemaUtils
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/references
-PAGE_ID = 62
-
-
-def get_films_by_reference(viewings):
-    films_by_reference = {}
-
-    for viewing in viewings:
-        if "keywords" in viewing.keys():
-            for keyword in viewing["keywords"]:
-                if keyword.startswith("reference-to-"):
-
-                    for reference in films_by_reference:
-                        if keyword in films_by_reference[reference]["keywords"]:
-                            films_by_reference[reference]["films"].append(viewing)
-                            break
-                    else:
-                        keyword = keyword[13:]
-
-                        if keyword.startswith("a-"):
-                            keyword = keyword[2:]
-
-                        if keyword.endswith("-character"):
-                            keyword = keyword[:-10]
-
-                        referenced = keyword.replace("-", " ")
-
-                        try:
-                            searches = wikipedia.search(referenced, suggestion=False)
-                            referenced_page = wikipedia.page(title=referenced, auto_suggest=False)
-
-                            page_title = referenced_page.title
-                            page_url = referenced_page.url
-
-                        except wikipedia.DisambiguationError as e:
-                            page_title = e.title
-                            page_title = page_title[0].upper() + page_title[1:]
-                            page_url = VCinemaUtils.generate_wikipedia_url(page_title)
-                        except wikipedia.PageError as _:
-                            if len(searches) > 0:
-                                try:
-                                    referenced_page = wikipedia.page(title=searches[0], auto_suggest=False)
-
-                                    page_title = referenced_page.title
-                                    page_url = referenced_page.url
-                                except wikipedia.DisambiguationError as e:
-                                    page_title = e.title
-                                    page_title = page_title[0].upper() + page_title[1:]
-                                    page_url = VCinemaUtils.generate_wikipedia_url(page_title)
-                            else:
-                                page_title = referenced.title()
-                                page_url = None
-
-                        if page_title in films_by_reference.keys():
-                            films_by_reference[page_title]["keywords"].append(keyword)
-
-                            if viewing not in films_by_reference[page_title]["films"]:
-                                films_by_reference[page_title]["films"].append(viewing)
-
-                        else:
-                            films_by_reference[page_title] = {"url": page_url,
-                                                              "keywords": [keyword],
-                                                              "films": [viewing]}
-
-    return films_by_reference
-
-
-def update_page(token_id, token_secret, films_by_reference_keyword):
-    page = build_page(films_by_reference_keyword)
-    Bookstack.update_page(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, PAGE_ID, markdown=page)
-
-
-def build_page(films_by_reference):
-    films_by_reference = OrderedDict(sorted(films_by_reference.items(), key=lambda t: t[0]))
-
-    table = "| Referenced | Films |\n| - | - |"
-
-    for reference, referenced in films_by_reference.items():
-        table += "\n"
-
-        row_data = []
-
-        reference_url = referenced["url"]
-        referenced_films = referenced["films"]
-
-        if reference_url is None:
-            row_data.append(reference)
-        else:
-            row_data.append(VCinemaUtils.generate_markdown_link(reference, reference_url))
-        row_data.append(VCinemaUtils.get_film_list(referenced_films))
-
-        table += " | ".join(row_data)
-
-    return table
--- a/wiki_pages/FilmsByYear.py
+++ b/wiki_pages/FilmsByYear.py
@ -1,35 +0,0 @@
-from collections import OrderedDict
-
-from bookstack import Bookstack
-from vcinema_utils import VCinemaUtils
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/films-by-release-year
-PAGE_ID = 24
-
-
-def get_films_by_year(viewings):
-    viewings_filtered_by_year = VCinemaUtils.filter_viewings(viewings, "year")
-
-    return viewings_filtered_by_year
-
-
-def update_page(token_id, token_secret, films_by_year):
-    page = build_page(films_by_year)
-    Bookstack.update_page(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, PAGE_ID, markdown=page)
-
-
-def build_page(films_by_year):
-    films_by_year_sorted = OrderedDict(sorted(films_by_year.items(), key=lambda t: t[0], reverse=True))
-
-    page = "| Year | Films |\n| - | - |"
-
-    for year in films_by_year_sorted.keys():
-        page += "\n"
-
-        row_data = []
-        row_data.append(str(year))
-        row_data.append(VCinemaUtils.get_film_list(films_by_year_sorted[year]))
-
-        page += " | ".join(row_data)
-
-    return page
--- a/wiki_pages/HiddenThemes.py
+++ b/wiki_pages/HiddenThemes.py
@ -1,86 +0,0 @@
-from collections import OrderedDict
-
-from bookstack import Bookstack
-from vcinema_utils import VCinemaUtils
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/films-by-reference
-PAGE_ID = 63
-
-
-def get_hidden_themes(viewings, token_id, token_secret):
-    # Bit horrible to need to request this again, but it affects the order of the result table
-    viewings_ungrouped = VCinemaUtils.get_vcinema_viewings(token_id, token_secret, combine_repeat_viewings=False)
-
-    # Copy keywords from grouped viewings to ungrouped viewings
-    for viewing_ungrouped in viewings_ungrouped:
-        for viewing in viewings:
-            if viewing['imdb_id'] == viewing_ungrouped['imdb_id']:
-                if 'keywords' in viewing:
-                    viewing_ungrouped['keywords'] = viewing['keywords']
-                    break
-
-    viewings_filtered_watch_date = VCinemaUtils.filter_viewings(viewings_ungrouped, "date_watched")
-
-    for date, viewings in viewings_filtered_watch_date.items():
-        viewing_dict = {"viewings": viewings}
-
-        viewings_filtered_watch_date[date] = viewing_dict
-
-    # Add hidden themes
-    for date, data in viewings_filtered_watch_date.items():
-        keyword_counts = {}
-
-        if len(data['viewings']) > 1:
-            for viewing in data['viewings']:
-                if 'keywords' in viewing:
-                    for keyword in viewing['keywords']:
-                        if keyword in keyword_counts.keys():
-                            keyword_counts[keyword] += 1
-                        else:
-                            keyword_counts[keyword] = 1
-
-            keyword_counts = {k: v for k, v in sorted(keyword_counts.items(), key=lambda item: item[1], reverse=True)}
-            hidden_themes = {}
-
-            for keyword in keyword_counts:
-                rating = float(keyword_counts[keyword]) / float(len(data['viewings']))
-                if rating > 0.5:
-                    hidden_themes[keyword] = rating
-
-            viewings_filtered_watch_date[date]['hidden_themes'] = hidden_themes
-
-    return viewings_filtered_watch_date
-
-
-def update_page(token_id, token_secret, hidden_themes):
-    page = build_page(hidden_themes)
-    Bookstack.update_page(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, PAGE_ID, markdown=page)
-
-
-def build_page(hidden_themes):
-    hidden_themes = OrderedDict(sorted(hidden_themes.items(), key=lambda t: t[0]))
-
-    table = "| Date | Films | Hidden Themes |\n| - | - | - |"
-
-    for date, data in hidden_themes.items():
-        table += "\n"
-
-        row_data = []
-        row_data.append(str(date))
-        row_data.append(VCinemaUtils.get_film_list(data['viewings']))
-        if 'hidden_themes' in data and data['hidden_themes'] != {}:
-            hidden_theme_labels = []
-
-            for hidden_theme in sorted(data['hidden_themes'].keys()):
-                if data['hidden_themes'][hidden_theme] == 1:
-                    hidden_theme_labels.append(hidden_theme)
-                else:
-                    hidden_theme_labels.append("<i>{} ({}%)</i>".format(hidden_theme, round(data['hidden_themes'][hidden_theme] * 100)))
-
-            row_data.append("<br>".join(hidden_theme_labels))
-        else:
-            row_data.append("N/A")
-
-        table += " | ".join(row_data)
-
-    return table
--- a/wiki_pages/KeywordScores.py
+++ b/wiki_pages/KeywordScores.py
@ -1,81 +0,0 @@
-from collections import OrderedDict
-from progress.bar import IncrementalBar
-import math
-from concurrent.futures import ThreadPoolExecutor
-
-from bookstack import Bookstack
-from imdb_utils import IMDbUtils
-from vcinema_utils import VCinemaUtils
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/keyword-scores
-PAGE_ID = 23
-
-
-def get_keyword_scores(viewings):
-    viewings_filtered_keyword = VCinemaUtils.filter_viewings(viewings, "keywords")
-
-    for keyword, viewings in viewings_filtered_keyword.items():
-        viewings_filtered_keyword[keyword] = {"vcinema_films": viewings}
-
-    min_vcinema_count = 2
-    min_imdb_count = 4
-
-    add_keyword_totals(viewings_filtered_keyword, min_vcinema_count)
-    add_keyword_scores(viewings_filtered_keyword, min_vcinema_count, min_imdb_count)
-
-    return viewings_filtered_keyword
-
-
-def update_page(token_id, token_secret, keyword_data):
-    page = build_page(keyword_data)
-    Bookstack.update_page(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, PAGE_ID, markdown=page)
-
-
-def add_keyword_totals(keywords, min_vcinema_count):
-    keyword_count = len([keyword for keyword in keywords.keys() if len(keywords[keyword]['vcinema_films']) >= min_vcinema_count])
-
-    with IncrementalBar(message='%(percent).1f%% - %(eta)ds remaining', max=keyword_count, check_tty=False) as bar:
-        with ThreadPoolExecutor(6) as executor:
-            for keyword, data in keywords.items():
-                if len(data['vcinema_films']) >= min_vcinema_count:
-                    executor.submit(add_keyword_total, keyword, keywords, bar)
-
-
-def add_keyword_total(keyword, keywords, progress_bar=None):
-    keyword_total = IMDbUtils.get_keyword_count(keyword)
-
-    keywords[keyword]['total'] = keyword_total
-
-    if progress_bar is not None:
-        progress_bar.next()
-
-
-def add_keyword_scores(keyword_data, min_vcinema_count, min_imdb_count):
-    for keyword in keyword_data.keys():
-        if 'total' in keyword_data[keyword]:
-            vcinema_count = len(keyword_data[keyword]['vcinema_films'])
-            total_count = keyword_data[keyword]['total']
-
-            if vcinema_count >= min_vcinema_count and total_count >= min_imdb_count:
-                score = vcinema_count / math.log(total_count)
-
-                keyword_data[keyword]['score'] = score
-
-
-def build_page(keyword_data, minimum_score=1.0):
-    keyword_data = {k: v for k, v in keyword_data.items() if 'score' in v and v['score'] >= minimum_score}
-    keyword_data = OrderedDict(sorted(keyword_data.items(), key=lambda t: t[1]['score'], reverse=True))
-
-    table = "| Keyword | Number of VCinema Films | Total IMDb entries | Score |\n| - | - | - | - |"
-
-    for keyword, data in keyword_data.items():
-        table += "\n"
-
-        row_data = []
-        row_data.append(str(keyword))
-        row_data.append(str(len(data['vcinema_films'])))
-        row_data.append(str(data['total']))
-        row_data.append(str(round(data['score'], 3)))
-        table += " | ".join(row_data)
-
-    return table
--- a/wiki_pages/ViewingsCsv.py
+++ b/wiki_pages/ViewingsCsv.py
@ -1,20 +0,0 @@
-from bs4 import BeautifulSoup
-
-from bookstack import Bookstack
-from vcinema_utils import VCinemaUtils
-
-# Page ID of https://wiki.jacknet.io/books/vcinema/page/csv
-PAGE_ID = 11
-
-
-def update_viewings_csv(token_id, token_secret):
-    print("Retrieving viewings page")
-    html_page = Bookstack.get_page_html(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, PAGE_ID)
-
-    soup = BeautifulSoup(html_page, 'html.parser')
-    csv_data = soup.find("code").text.strip().encode('utf-8')
-
-    existing_attachment_id = VCinemaUtils.get_viewings_csv_attachment_id(token_id, token_secret)
-    print("Updating file")
-    Bookstack.update_attachment(VCinemaUtils.JACKNET_WIKI_URL, token_id, token_secret, existing_attachment_id, "vcinema.csv", csv_data, PAGE_ID)
-    print("File updated")
--- a/wiki_pages/init.py
+++ b/wiki_pages/init.py
--- a/1
+++ b/1
@ -0,0 +1 @@
+Subproject commit 88be36d5cd7378a01d9861726bf123715fe81d4a
				`@ -1 +0,0 @@`
				`Subproject commit 8f6e38cb337bcf51b0790f2db7001681ceb9338f`
				`@ -0,0 +1 @@`
				`Subproject commit 88be36d5cd7378a01d9861726bf123715fe81d4a`