vcinema/vcinema_utils/VCinemaUtils.py

from collections import Counter
from concurrent.futures import ThreadPoolExecutor, as_completed
import functools

from imdb_utils import IMDbUtils
from bookstack import Bookstack


JACKNET_WIKI_URL = "https://wiki.jacknet.io"


def get_viewings_csv_attachment_id(token_id, token_secret):
    attachments = Bookstack.get_attachments(JACKNET_WIKI_URL, token_id, token_secret)

    # Page ID of "https://wiki.jacknet.io/books/vcinema/page/csv"
    page_id = 11
    viewings_csv_file_name = "vcinema.csv"

    return next((x['id'] for x in attachments if x['uploaded_to'] == page_id and x['name'] == viewings_csv_file_name), None)


def get_vcinema_viewings(token_id, token_secret, combine_repeat_viewings=True):
    attachment_id = get_viewings_csv_attachment_id(token_id, token_secret)

    viewings_csv = Bookstack.get_attachment(JACKNET_WIKI_URL, token_id, token_secret, attachment_id)
    viewings_csv = viewings_csv.decode("utf-8")
    viewings_csv_rows = viewings_csv.strip().split("\n")

    headers = viewings_csv_rows.pop(0).split(",")
    viewings = [dict(zip(headers, row.split(","))) for row in viewings_csv_rows]

    for viewing in viewings:
        viewing['viewings'] = [{'date_watched': viewing['date_watched'], 'season': viewing['season'], 'rating': viewing['rating']}]
        viewing.pop('date_watched')
        viewing.pop('season')
        viewing.pop('rating')

    if combine_repeat_viewings:
        watch_counts = Counter([x['imdb_id'] for x in viewings])
        repeat_watches = [k for k, v in watch_counts.items() if v > 1]

        for film in repeat_watches:
            viewing_indexes = [index for index, viewing in enumerate(viewings) if viewing['imdb_id'] == film]

            first_watch = viewings[viewing_indexes[0]]

            for index in viewing_indexes[1::]:
                first_watch['viewings'].append(viewings[index]['viewings'])

            for index in reversed(viewing_indexes[1::]):
                viewings.pop(index)

    return viewings


def increment_progressbar(bar, _):
    bar.next()


def add_imdb_data_to_viewings(viewings, field_names, progressbar=None):
    with ThreadPoolExecutor(4) as executor:
        future_to_url = {executor.submit(IMDbUtils.get_movie, viewing['imdb_id']) for viewing in viewings}

        if progressbar is not None:
            for this_future in future_to_url:
                this_future.add_done_callback(functools.partial(increment_progressbar, progressbar))

        for future in as_completed(future_to_url):
            imdb_data = future.result()

            for viewing in viewings:
                if viewing['imdb_id'] == imdb_data.movieID:
                    for field_name in field_names:
                        if field_name in imdb_data:
                            viewing[field_name] = imdb_data[field_name]


def filter_viewings(viewings, filter_field, progressbar=None):
    viewings_filtered = {}

    for viewing in viewings:
        if filter_field in viewing:
            viewing_field = viewing[filter_field]
            if isinstance(viewing_field, list):
                for fve in list(viewing_field):
                    if fve in viewings_filtered.keys():
                        viewings_filtered[fve] += [viewing]
                    else:
                        viewings_filtered[fve] = [viewing]
            else:
                if viewing_field in viewings_filtered.keys():
                    viewings_filtered[viewing_field] += [viewing]
                else:
                    viewings_filtered[viewing_field] = [viewing]

        if progressbar is not None:
            progressbar.next()

    return viewings_filtered
fix files by year page 2022-02-27 14:34:23 +00:00			`from collections import Counter`
			`from concurrent.futures import ThreadPoolExecutor, as_completed`
use callback for tasks instead of adding extra function 2022-02-27 15:23:20 +00:00			`import functools`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00
			`from imdb_utils import IMDbUtils`
fix files by year page 2022-02-27 14:34:23 +00:00			`from bookstack import Bookstack`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00

move url to utils 2022-02-20 21:53:36 +00:00			`JACKNET_WIKI_URL = "https://wiki.jacknet.io"`


use csv file instead of reading from csv page 2022-02-20 22:00:14 +00:00			`def get_viewings_csv_attachment_id(token_id, token_secret):`
fix files by year page 2022-02-27 14:34:23 +00:00			`attachments = Bookstack.get_attachments(JACKNET_WIKI_URL, token_id, token_secret)`
use csv file instead of reading from csv page 2022-02-20 22:00:14 +00:00
remove ) 2022-02-20 22:01:38 +00:00			`# Page ID of "https://wiki.jacknet.io/books/vcinema/page/csv"`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00			`page_id = 11`
use csv file instead of reading from csv page 2022-02-20 22:00:14 +00:00			`viewings_csv_file_name = "vcinema.csv"`

			`return next((x['id'] for x in attachments if x['uploaded_to'] == page_id and x['name'] == viewings_csv_file_name), None)`


fix files by year page 2022-02-27 14:34:23 +00:00			`def get_vcinema_viewings(token_id, token_secret, combine_repeat_viewings=True):`
use csv file instead of reading from csv page 2022-02-20 22:00:14 +00:00			`attachment_id = get_viewings_csv_attachment_id(token_id, token_secret)`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00
fix files by year page 2022-02-27 14:34:23 +00:00			`viewings_csv = Bookstack.get_attachment(JACKNET_WIKI_URL, token_id, token_secret, attachment_id)`
use csv file instead of reading from csv page 2022-02-20 22:00:14 +00:00			`viewings_csv = viewings_csv.decode("utf-8")`
			`viewings_csv_rows = viewings_csv.strip().split("\n")`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00
use csv file instead of reading from csv page 2022-02-20 22:00:14 +00:00			`headers = viewings_csv_rows.pop(0).split(",")`
			`viewings = [dict(zip(headers, row.split(","))) for row in viewings_csv_rows]`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00
add season and rating to viewing list for each film 2022-03-08 22:44:20 +00:00			`for viewing in viewings:`
			`viewing['viewings'] = [{'date_watched': viewing['date_watched'], 'season': viewing['season'], 'rating': viewing['rating']}]`
			`viewing.pop('date_watched')`
			`viewing.pop('season')`
			`viewing.pop('rating')`

fix files by year page 2022-02-27 14:34:23 +00:00			`if combine_repeat_viewings:`
			`watch_counts = Counter([x['imdb_id'] for x in viewings])`
			`repeat_watches = [k for k, v in watch_counts.items() if v > 1]`

			`for film in repeat_watches:`
			`viewing_indexes = [index for index, viewing in enumerate(viewings) if viewing['imdb_id'] == film]`

			`first_watch = viewings[viewing_indexes[0]]`

			`for index in viewing_indexes[1::]:`
add season and rating to viewing list for each film 2022-03-08 22:44:20 +00:00			`first_watch['viewings'].append(viewings[index]['viewings'])`
fix files by year page 2022-02-27 14:34:23 +00:00
			`for index in reversed(viewing_indexes[1::]):`
			`viewings.pop(index)`

add update_films_by_year_page script 2022-02-20 21:26:38 +00:00			`return viewings`


use callback for tasks instead of adding extra function 2022-02-27 15:23:20 +00:00			`def increment_progressbar(bar, _):`
			`bar.next()`
fix files by year page 2022-02-27 14:34:23 +00:00

pass bar into add_imdb_data_to_viewings method 2022-02-27 14:41:52 +00:00			`def add_imdb_data_to_viewings(viewings, field_names, progressbar=None):`
			`with ThreadPoolExecutor(4) as executor:`
use callback for tasks instead of adding extra function 2022-02-27 15:23:20 +00:00			`future_to_url = {executor.submit(IMDbUtils.get_movie, viewing['imdb_id']) for viewing in viewings}`

			`if progressbar is not None:`
			`for this_future in future_to_url:`
			`this_future.add_done_callback(functools.partial(increment_progressbar, progressbar))`
fix files by year page 2022-02-27 14:34:23 +00:00
pass bar into add_imdb_data_to_viewings method 2022-02-27 14:41:52 +00:00			`for future in as_completed(future_to_url):`
			`imdb_data = future.result()`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00
pass bar into add_imdb_data_to_viewings method 2022-02-27 14:41:52 +00:00			`for viewing in viewings:`
			`if viewing['imdb_id'] == imdb_data.movieID:`
			`for field_name in field_names:`
			`if field_name in imdb_data:`
			`viewing[field_name] = imdb_data[field_name]`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00

refactor script to take progress bar as arg 2022-02-27 15:34:06 +00:00			`def filter_viewings(viewings, filter_field, progressbar=None):`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00			`viewings_filtered = {}`

refactor script to take progress bar as arg 2022-02-27 15:34:06 +00:00			`for viewing in viewings:`
			`if filter_field in viewing:`
			`viewing_field = viewing[filter_field]`
			`if isinstance(viewing_field, list):`
			`for fve in list(viewing_field):`
			`if fve in viewings_filtered.keys():`
			`viewings_filtered[fve] += [viewing]`
fix files by year page 2022-02-27 14:34:23 +00:00			`else:`
refactor script to take progress bar as arg 2022-02-27 15:34:06 +00:00			`viewings_filtered[fve] = [viewing]`
			`else:`
			`if viewing_field in viewings_filtered.keys():`
			`viewings_filtered[viewing_field] += [viewing]`
			`else:`
			`viewings_filtered[viewing_field] = [viewing]`
fix files by year page 2022-02-27 14:34:23 +00:00
refactor script to take progress bar as arg 2022-02-27 15:34:06 +00:00			`if progressbar is not None:`
			`progressbar.next()`
add update_films_by_year_page script 2022-02-20 21:26:38 +00:00
			`return viewings_filtered`