T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf ·...
Transcript of T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf ·...
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Topicos em Seguranca da Informacao
Aula BA+ML
Ivan Sendin
FACOM - Universidade Federal de [email protected],[email protected]
18 de outubro de 2019
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Aeroporto Internacional de Miami recebe primeiraATM de Bitcoin
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Investigacoes da CVM
300 ate o final do ano (124/2018)
Unick Forex
Movimentou de R$2.4 a R$9 bilhoes (?)
Algumas prisoes
B1500 apreendidos
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
WTV
Welcome to Video
Tor hidden service
Coreia do Sul
Pagamento em Bitcoin
Chainalysis in Action: DOJ Announces Shutdown ofLargest Child Pornography Website
DOJ
337 presos em 38 paises
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
WTV
1.3 Milhoes de enderecos BTC
$353,000
Chainalysis Reactor
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
IC/TCC?
Identificar o comportamento de tipo ”estrela”
Clusters que recebem bitcoins de clusters”conhecidos”
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
IC/TCC?
Labelling de enderecos usando google e redes sociais
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Machine Learning
Classificacao de clusters
ML caixa-preta
“Prova de conceito”
Resultados de fato exigem mais cuidados...
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
# https://scikit-learn.org/stable/
# https://www.youtube.com/watch?v=cKxRvEZd3Mw
from sklearn import tree
#existem outros...
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Fonte: https://en.wikipedia.org/wiki/Decision tree learning
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
# caracteristica da casca
SMOOTH=1
BUMPY =0
# a classes
APPLE=0
ORANGE=1
# o vetor caracteristica, peso e casca
# obtidos de dados "reais"
features = [
[140,SMOOTH],
[130,SMOOTH],
[150,BUMPY],
[170,BUMPY]]
# as classes
labels = [APPLE,APPLE,ORANGE,ORANGE]
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
# o treinamento/preparacao
clf = tree.DecisionTreeClassifier()
clf = clf.fit(features, labels)
# a predicao
print clf.predict([[150,BUMPY],[120,SMOOTH],[190,SMOOTH]])
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
luke@xwing:~$ python HelloWorld.py
[1 0 0]
luke@xwing:~$ python HelloWorld.py
[1 0 1]
As macas sao lisas e pequenas
As laranjas sao rugosas e maiores
A fruta [190, SMOOTH] pode ser laranja ou maca
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Cluster obtidos por H1
Classificacao de clusters
Exchange/Nao Exchange
(apostas, mineracao,..)
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Como treinar? Como saber se e uma exchange??
walletexplorer.org
De todos os clusters, separe alguns para treinar eoutros para classificar
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Caracteristicas
N de Txs
N de Enderecos
BTC In
BTC Out
Gini
Bendford: frequencia do i -esimo digito nos valoresdas txs
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Avaliacao
Implementar a classificacao dos clusters H1
Codigo e resultados
Valor 30.0
3 semanas
Alternativamete: clusterizacao(ML?) dos clustersH1
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Avaliacao
Implementar a classificacao dos clusters H1
Codigo e resultados
Valor 30.0
3 semanas
Alternativamete: clusterizacao(ML?) dos clustersH1
(As dificuldades sao as mesmas!)
TSEG-BA
Ivan Sendin
news
Mais chainanalysis
Crash Course emML
Implementacoes
Avaliacao II
Alternativa
Determinar o Fluxo de BTC entre Exchanges
Exchanges: walletexeplorer.com/parsing
Txs: por uma janela de tempo
Montar um grafo (grafico) : multigrafo ponderado
Qualidade da solucao: tecnicas, codigo,...
IC
Valor 30.0 / 3 semanas