Kvantifiointi

Mallin numeerisen tarkkuuden pienentäminen kustannusten ja nopeuden parantamiseksi.

Miksi tällä on merkitystä

Kvantifiointi tekee suurista malleista ajettavia pienemmällä laitteistolla.

Käytännössä

Ollaman llama3.2-malli käyttää kvantisointia mahtuakseen Hetzner-palvelimelle.

Liittyvät termit

Takaisin sanastoon