Classe: BetanoBrowser
Essa é a classe principal do projeto, onde realizamos a extração das informações do site, realiza tratamento dos dados para no fim chegar a lista de JSON principal que será armazenada no banco de dados.
Métodos da Classe
Source code in betCrawler\Browser\betanoCr.py
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 |
|
dataframe_to_json(dfs)
Converte os DataFrames de jogos em uma lista de dicionários JSON.
Source code in betCrawler\Browser\betanoCr.py
95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 |
|
extract_games(df, start, end, regex_pattern)
Extrai os jogos do DataFrame com base nos padrões de início e fim fornecidos.
Source code in betCrawler\Browser\betanoCr.py
64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 |
|
get_html_from_url(query='*')
Obtém o HTML da página e retorna as informações relevantes em um DataFrame.
Source code in betCrawler\Browser\betanoCr.py
32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 |
|
open_url(url)
Abre uma URL no navegador.
Source code in betCrawler\Browser\betanoCr.py
26 27 28 29 30 |
|
search_text(text, df)
Procura por um texto específico na coluna 'aa_innerText' do DataFrame e retorna as linhas correspondentes.
Source code in betCrawler\Browser\betanoCr.py
48 49 50 51 52 53 54 |
|
select_by_text(df, text)
Seleciona linhas do DataFrame com base no texto fornecido na coluna 'aa_className'.
Source code in betCrawler\Browser\betanoCr.py
56 57 58 59 60 61 62 |
|