Select Page

El passat 13 de març, Andrea Suárez, Fernando Gastón i Marcel Morillas, de la Unitat de Transferència del Coneixement del CRM (KTU), juntament amb Pau Varela i Mariona Fucho, de comunicació i divulgació, van participar a l’EspaiCiència dins del marc del Saló de l’Ensenyament.

Durant l’esdeveniment, van realitzar dos tallers. El primer, dirigit per l’Andrea Suárez, el Fernando Gaston i la Mariona Fucho, va consistir en una sessió pràctica sobre l’ús de la criptografia per a la compressió i transmissió eficient de dades.

Considerant la gran quantitat de dades generades cada minut i els costos associats amb la seva transmissió i emmagatzematge, la KTU, en col·laboració amb l’ALBA sincrotró, participa en el programa DYSEDAS per a la compressió de dades. Segons l’Andrea: “L’objectiu del projecte DYSEDAS és crear un programari per a la compressió d’imatges volumètriques, és a dir, una seqüència de moltes imatges molt semblants entre elles. Hi ha molts marges per a la compressió en aquest cas, atès que hi ha redundància de les dades, i s’estan explorant combinacions d’algorismes coneguts com ara el codi Huffman o el codi Golomb, juntament amb una reordenació o transformació reversibles de les imatges.”

 

Però, què és exactament la compressió?

La compressió té com a objectiu reduir la grandària dels fitxers per minimitzar-ne els costos.

En el taller, els participants van ser desafiats a codificar una frase de 12 caràcters com “me mira a mi” (incloent-hi els espais) i, utilitzant tres tipus de codis, van investigar si era possible encriptar-los i desencriptar-los. Van observar que un d’aquests codis era molt eficient en la compressió de dades, però no permetia la recuperació de la informació, descobrint així el mètode Huffman.

Què és el mètode Huffman?

El mètode Huffman és un algorisme de compressió de dades que crea codis prefix, assegurant que cap cadena de bits que representa un símbol sigui prefix d’una altra, òptims per a la compressió sense pèrdua d’informació. Va ser desenvolupat per David A. Huffman mentre estudiava a l’MIT i publicat el 1952.

Aquest mètode fa servir una taula de codis de longitud variable basada en la probabilitat o freqüència estimada d’aparició de cada símbol font. Els símbols més comuns són representats amb menys bits, reduint la redundància.

Com funciona el mètode Huffman?

  1. Analitzar l’entrada: Identifica els símbols únics i calcula les seves freqüències d’aparició.
  2. Crear nodes inicials: Crea un node per a cada símbol, assignant la seva freqüència com a pes inicial.
  3. Construir l’arbre Huffman:
    • Combina els dos nodes amb menor freqüència per crear un nou node, sumant les seves freqüències.
    • Inserir el nou node: Insereix el nou node a l’arbre mantenint l’ordre de freqüència.
  4. Repetir el procés fins que només quedi un node a l’arbre, que serà l’arrel de l’arbre Huffman.
  5. Assignar codis: Recorre l’arbre assignant 0 a les branques esquerra i 1 a les branques dreta, registrant el codi binari associat a cada símbol.
  6. Crear la taula de codis: Utilitza els codis per construir una taula de codis Huffman.

És important assenyalar que tot i ser eficient en la codificació de símbols per separat, el mètode Huffman no sempre és la millor opció comparat amb altres mètodes de compressió com l’arithmetic coding o els sistemes numèrics asimètrics.

Voleu posar-vos a proba?

Proveu a codificar ‘STATISTICS’ i cliqueu-hi a sobre per veure la resposta.  Tingueu en compte que la solució no és única.

Symbol Probability
S 0.3
T 0.3
I 0.2
A 0.1
C 0.1

 

 

El segon taller, a càrrec de l’Andrea Suárez, el Marcel Morillas i en Pau Varela, van explicar en què consisteix la incertesa, específicament, aplicada a models d’intel·ligència artificial.

Per que? Basicament, ens interessa dissenyar sistemes que puguin quantificar la seguretat de les respostes que donen, já que la IA pot ser entrenada amb dadees que no reflecteixin la realitat degut a biaixos de gènere, dades errònies o falta de representació de col·lectius minoritaris.

I… Com puc utilitzar la IA per la ciberseguretat?

El phishing és una estafa en la qual un ciberdelinqüent es fa pasar per algú altre per intentar extreure información sobre la persona afectada maliciosament.

En paraules d’Axel Masó, membre de la KTU, “al projecte LICSAI, la KTU ha elaborat una eina per quantificar la incertesa d’un model de Machine Learning (desenvolupat per I2Cat) que permet predir, donat el comportament virtual d’un individu, quin és el risc que aquest sigui víctima de phishing.”

En el taller, les estudiants havien de llegir uns textos i opinar sobre com de segurs estaven que allò podía ser phishing i, a continuación, entre les dades de tots els participants, van estudiar les gràfiques resultants per entendre el seu significat.

Subscribe for more CRM News

Stay updated to our mailing list to get the lastest information about CRM activities.

CRM Comm

Pau Varela & Mariona Fucho

CRMComm@crm.cat

 

Roser Homs participa al projecte (In)visibles i (O)cultes

Roser Homs participa al projecte (In)visibles i (O)cultes

El 20 de desembre, el Museu de Ciències Naturals de Barcelona va acollir la cloenda del projecte (In)visibles i (O)cultes, amb la participació de Roser Homs, investigadora del CRM, que va oferir una xarrada als estudiants sobre la seva recerca i...

Xavier Tolsa, Premi Nacional d’Investigació 2024

Xavier Tolsa, Premi Nacional d’Investigació 2024

Xavier Tolsa, professor ICREA al Departament de Matemàtiques de la UAB i adscrit al CRM, ha rebut el Premi Nacional d'Investigació 2024 en la modalitat Julio Rey Pastor pel seu treball en àrees com l'anàlisi harmònic i la teoria geomètrica de...

Eva Miranda Awarded Prestigious Gauß Professorship

Eva Miranda Awarded Prestigious Gauß Professorship

The Gauß Professorship, awarded by the Göttingen Academy of Sciences and Humanities, is a prestigious recognition given to scientists who excel in fields significant to Carl Friedrich Gauss, such as mathematics, physics, astronomy, and geophysics....