Commits · natasa365/whisper.cpp

ggml : fix compile warnings (unused vars) (llama/4966)

97fa2e3
unverified

ggerganov commited on Feb 11, 2024

ggml : add mmla kernels for quantized GEMM (llama/4966)

0d50a29
unverified

snadampal commited on Feb 11, 2024

ggml : fix `error C2078: too many initializers` for MSVC ARM64 (llama/5404)

8ebb36c
unverified

Michael Podvitskiy commited on Feb 9, 2024

Slight quantization improvement for Q4_K and Q5_K (llama/5361)

e3cd020
unverified

Kawrakow

ikawrakow commited on Feb 6, 2024

iq2_xxs: tune quantization (llama/5320)

11e5f6b
unverified

Kawrakow

ikawrakow commited on Feb 5, 2024

Faster AVX2 dot product for IQ2_XS (llama/5187)

187ae44
unverified

Kawrakow

ikawrakow

PeterReid commited on Jan 30, 2024

SOTA 3-bit quants (llama/5196)

4649943
unverified

Kawrakow

ikawrakow commited on Jan 30, 2024

ggml : add IQ2 to test-backend-ops + refactoring (llama/4990)

227f2ae
unverified

ggerganov commited on Jan 17, 2024

ggml : importance matrix support for legacy quants (llama/4969)

d8bb9d8
unverified

Kawrakow

ikawrakow commited on Jan 16, 2024

Add ability to use importance matrix for all k-quants (llama/4930)

7032309
unverified

Kawrakow

ikawrakow commited on Jan 14, 2024

2-bit quantizations (llama/4897)

8a399ab
unverified

Kawrakow

ikawrakow commited on Jan 14, 2024

ggml : fix 32-bit ARM compat for IQ2_XS (#1758)

d5836c9
unverified

ggerganov commited on Jan 12, 2024

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856)

5e827d5
unverified

Kawrakow

ikawrakow commited on Jan 11, 2024

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828)

efed5ba
unverified

ggerganov commited on Jan 9, 2024

SOTA 2-bit quants (llama/4773)

75de5bf
unverified

Kawrakow

ikawrakow commited on Jan 8, 2024

ggml : add ggml_vdotq_s32 alias (llama/4715)

96dc902

ggerganov commited on Dec 31, 2023

sync : ggml (VMM, sync-ggml-am, dotprod ARM fixes, CUDA fixes) (#1691)

919a447
unverified

ggerganov commited on Dec 29, 2023

sync : ggml (ggml_scale, ggml_row_size, etc.) (#1677)

aa86ade
unverified

ggerganov commited on Dec 22, 2023

sync : ggml (Metal fixes, new ops, tests) (#1633)

a0d4b48
unverified

ggerganov commited on Dec 13, 2023

sync : ggml (new ops, new backend, etc) (#1602)

895e87a
unverified

ggerganov commited on Dec 7, 2023

sync : ggml (ggml-alloc + linker + gguf fixes) (#1501)

58507b9
unverified

ggerganov commited on Nov 17, 2023

sync : ggml (backend v2, k-quants, CUDA opts, Metal opts, etc.) (#1422)

7006035
unverified

ggerganov Chris Raethke commited on Nov 3, 2023

Spaces:

natasa365
/

whisper.cpp

Sleeping

Commit History

ggml : fix compile warnings (unused vars) (llama/4966)

97fa2e3
unverified

ggml : add mmla kernels for quantized GEMM (llama/4966)

0d50a29
unverified

ggml : fix `error C2078: too many initializers` for MSVC ARM64 (llama/5404)

8ebb36c
unverified

Slight quantization improvement for Q4_K and Q5_K (llama/5361)

e3cd020
unverified

iq2_xxs: tune quantization (llama/5320)

11e5f6b
unverified

Faster AVX2 dot product for IQ2_XS (llama/5187)

187ae44
unverified

SOTA 3-bit quants (llama/5196)

4649943
unverified

ggml : add IQ2 to test-backend-ops + refactoring (llama/4990)

227f2ae
unverified

ggml : importance matrix support for legacy quants (llama/4969)

d8bb9d8
unverified

Add ability to use importance matrix for all k-quants (llama/4930)

7032309
unverified

2-bit quantizations (llama/4897)

8a399ab
unverified

ggml : fix 32-bit ARM compat for IQ2_XS (#1758)

d5836c9
unverified

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856)

5e827d5
unverified

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828)

efed5ba
unverified

SOTA 2-bit quants (llama/4773)

75de5bf
unverified

ggml : add ggml_vdotq_s32 alias (llama/4715)

96dc902

sync : ggml (VMM, sync-ggml-am, dotprod ARM fixes, CUDA fixes) (#1691)

919a447
unverified

sync : ggml (ggml_scale, ggml_row_size, etc.) (#1677)

aa86ade
unverified

sync : ggml (Metal fixes, new ops, tests) (#1633)

a0d4b48
unverified

sync : ggml (new ops, new backend, etc) (#1602)

895e87a
unverified

sync : ggml (ggml-alloc + linker + gguf fixes) (#1501)

58507b9
unverified

sync : ggml (backend v2, k-quants, CUDA opts, Metal opts, etc.) (#1422)

7006035
unverified

Commit History

ggml : fix compile warnings (unused vars) (llama/4966) 97fa2e3 unverified

ggml : add mmla kernels for quantized GEMM (llama/4966) 0d50a29 unverified

ggml : fix `error C2078: too many initializers` for MSVC ARM64 (llama/5404) 8ebb36c unverified

Slight quantization improvement for Q4_K and Q5_K (llama/5361) e3cd020 unverified

iq2_xxs: tune quantization (llama/5320) 11e5f6b unverified

Faster AVX2 dot product for IQ2_XS (llama/5187) 187ae44 unverified

SOTA 3-bit quants (llama/5196) 4649943 unverified

ggml : add IQ2 to test-backend-ops + refactoring (llama/4990) 227f2ae unverified

ggml : importance matrix support for legacy quants (llama/4969) d8bb9d8 unverified

Add ability to use importance matrix for all k-quants (llama/4930) 7032309 unverified

2-bit quantizations (llama/4897) 8a399ab unverified

ggml : fix 32-bit ARM compat for IQ2_XS (#1758) d5836c9 unverified

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856) 5e827d5 unverified

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828) efed5ba unverified

SOTA 2-bit quants (llama/4773) 75de5bf unverified

ggml : add ggml_vdotq_s32 alias (llama/4715) 96dc902

sync : ggml (VMM, sync-ggml-am, dotprod ARM fixes, CUDA fixes) (#1691) 919a447 unverified

sync : ggml (ggml_scale, ggml_row_size, etc.) (#1677) aa86ade unverified

sync : ggml (Metal fixes, new ops, tests) (#1633) a0d4b48 unverified

sync : ggml (new ops, new backend, etc) (#1602) 895e87a unverified

sync : ggml (ggml-alloc + linker + gguf fixes) (#1501) 58507b9 unverified

sync : ggml (backend v2, k-quants, CUDA opts, Metal opts, etc.) (#1422) 7006035 unverified

ggml : fix compile warnings (unused vars) (llama/4966)

97fa2e3
unverified

ggml : add mmla kernels for quantized GEMM (llama/4966)

0d50a29
unverified

ggml : fix `error C2078: too many initializers` for MSVC ARM64 (llama/5404)

8ebb36c
unverified

Slight quantization improvement for Q4_K and Q5_K (llama/5361)

e3cd020
unverified

iq2_xxs: tune quantization (llama/5320)

11e5f6b
unverified

Faster AVX2 dot product for IQ2_XS (llama/5187)

187ae44
unverified

SOTA 3-bit quants (llama/5196)

4649943
unverified

ggml : add IQ2 to test-backend-ops + refactoring (llama/4990)

227f2ae
unverified

ggml : importance matrix support for legacy quants (llama/4969)

d8bb9d8
unverified

Add ability to use importance matrix for all k-quants (llama/4930)

7032309
unverified

2-bit quantizations (llama/4897)

8a399ab
unverified

ggml : fix 32-bit ARM compat for IQ2_XS (#1758)

d5836c9
unverified

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856)

5e827d5
unverified

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828)

efed5ba
unverified

SOTA 2-bit quants (llama/4773)

75de5bf
unverified

ggml : add ggml_vdotq_s32 alias (llama/4715)

96dc902

sync : ggml (VMM, sync-ggml-am, dotprod ARM fixes, CUDA fixes) (#1691)

919a447
unverified

sync : ggml (ggml_scale, ggml_row_size, etc.) (#1677)

aa86ade
unverified

sync : ggml (Metal fixes, new ops, tests) (#1633)

a0d4b48
unverified

sync : ggml (new ops, new backend, etc) (#1602)

895e87a
unverified

sync : ggml (ggml-alloc + linker + gguf fixes) (#1501)

58507b9
unverified

sync : ggml (backend v2, k-quants, CUDA opts, Metal opts, etc.) (#1422)

7006035
unverified