entropic/i__inference__backend_8h_source.html

// SPDX-License-Identifier: Apache-2.0

#pragma once


#include <entropic/types/error.h>


#include <stddef.h>

#include <stdint.h>


#ifdef __cplusplus

extern "C" {

#endif


typedef struct entropic_inference_backend* entropic_inference_backend_t;


/* ── Lifecycle ─────────────────────────────────────────── */


entropic_error_t entropic_inference_load(

    entropic_inference_backend_t backend,

    const char* config_json);


entropic_error_t entropic_inference_activate(

    entropic_inference_backend_t backend);


entropic_error_t entropic_inference_deactivate(

    entropic_inference_backend_t backend);


entropic_error_t entropic_inference_unload(

    entropic_inference_backend_t backend);


int entropic_inference_state(entropic_inference_backend_t backend);


/* ── Generation ────────────────────────────────────────── */


entropic_error_t entropic_inference_generate(

    entropic_inference_backend_t backend,

    const char* messages_json,

    const char* params_json,

    char** result_json);


entropic_error_t entropic_inference_generate_with_cancel(

    entropic_inference_backend_t backend,

    const char* messages_json,

    const char* params_json,

    char** result_json,

    int* cancel_flag);


entropic_error_t entropic_inference_generate_streaming(

    entropic_inference_backend_t backend,

    const char* messages_json,

    const char* params_json,

    void (*on_token)(const char* token, size_t len, void* user_data),

    void* user_data,

    int* cancel_flag);


entropic_error_t entropic_inference_complete(

    entropic_inference_backend_t backend,

    const char* prompt,

    const char* params_json,

    char** result_json);


/* ── Utility ───────────────────────────────────────────── */


int entropic_inference_count_tokens(

    entropic_inference_backend_t backend,

    const char* text,

    size_t text_len);


void entropic_inference_destroy(entropic_inference_backend_t backend);


void entropic_inference_free(void* ptr);


/* ── Capability + state queries (v1.9.13) ─────────────────── */


int entropic_inference_supports(

    entropic_inference_backend_t backend,

    int capability);


uint32_t entropic_inference_capabilities(

    entropic_inference_backend_t backend);


char* entropic_inference_info(

    entropic_inference_backend_t backend);


entropic_error_t entropic_inference_save_state(

    entropic_inference_backend_t backend,

    int seq_id,

    void** buffer,

    size_t* buffer_size);


entropic_error_t entropic_inference_restore_state(

    entropic_inference_backend_t backend,

    int seq_id,

    const void* buffer,

    size_t buffer_size);


entropic_error_t entropic_inference_clear_state(

    entropic_inference_backend_t backend,

    int seq_id);


entropic_error_t entropic_inference_generate_seq(

    entropic_inference_backend_t backend,

    int seq_id,

    const char* messages_json,

    const char* params_json,

    char** result_json);


entropic_error_t entropic_inference_generate_streaming_seq(

    entropic_inference_backend_t backend,

    int seq_id,

    const char* messages_json,

    const char* params_json,

    void (*on_token)(const char* token, size_t len, void* user_data),

    void* user_data,

    int* cancel_flag);


/* ── Inference log control (v2.0.1) ──────────────────── */


void entropic_inference_log_to_file(const char* path);


void entropic_inference_log_silence(void);


#ifdef __cplusplus

}

#endif


/*

 * Plugin export requirements:

 *

 *   extern "C" ENTROPIC_EXPORT int entropic_plugin_api_version();

 *   extern "C" ENTROPIC_EXPORT entropic_inference_backend_t

 *       entropic_create_inference_backend();

 */

error.h
Error types for cross-.so error reporting.

entropic_error_t
entropic_error_t
Error codes returned by all C API functions.
Definition error.h:35

entropic_inference_generate_streaming_seq
entropic_error_t entropic_inference_generate_streaming_seq(entropic_inference_backend_t backend, int seq_id, const char *messages_json, const char *params_json, void(*on_token)(const char *token, size_t len, void *user_data), void *user_data, int *cancel_flag)
Streaming generation with explicit sequence ID.

entropic_inference_backend_t
struct entropic_inference_backend * entropic_inference_backend_t
Opaque handle to an inference backend instance.
Definition i_inference_backend.h:42

entropic_inference_unload
entropic_error_t entropic_inference_unload(entropic_inference_backend_t backend)
Unload model completely (→ COLD).
Definition inference_c_api.cpp:277

entropic_inference_count_tokens
int entropic_inference_count_tokens(entropic_inference_backend_t backend, const char *text, size_t text_len)
Count tokens in text using model's tokenizer.
Definition inference_c_api.cpp:548

entropic_inference_activate
entropic_error_t entropic_inference_activate(entropic_inference_backend_t backend)
Activate model on GPU (WARM → ACTIVE).
Definition inference_c_api.cpp:238

entropic_inference_capabilities
uint32_t entropic_inference_capabilities(entropic_inference_backend_t backend)
Get all supported capabilities as bitmask.

entropic_inference_log_silence
void entropic_inference_log_silence(void)
Silence all llama/ggml log output.
Definition inference_c_api.cpp:717

entropic_inference_generate_streaming
entropic_error_t entropic_inference_generate_streaming(entropic_inference_backend_t backend, const char *messages_json, const char *params_json, void(*on_token)(const char *token, size_t len, void *user_data), void *user_data, int *cancel_flag)
Generate with streaming token callback.
Definition inference_c_api.cpp:476

entropic_inference_clear_state
entropic_error_t entropic_inference_clear_state(entropic_inference_backend_t backend, int seq_id)
Clear/reset model state.

entropic_inference_generate_seq
entropic_error_t entropic_inference_generate_seq(entropic_inference_backend_t backend, int seq_id, const char *messages_json, const char *params_json, char **result_json)
Generate with explicit sequence ID.

entropic_inference_info
char * entropic_inference_info(entropic_inference_backend_t backend)
Get backend metadata as JSON.

entropic_inference_complete
entropic_error_t entropic_inference_complete(entropic_inference_backend_t backend, const char *prompt, const char *params_json, char **result_json)
Raw text completion without chat template.
Definition inference_c_api.cpp:519

entropic_inference_generate
entropic_error_t entropic_inference_generate(entropic_inference_backend_t backend, const char *messages_json, const char *params_json, char **result_json)
Generate a response from messages (batch mode).
Definition inference_c_api.cpp:317

entropic_inference_load
entropic_error_t entropic_inference_load(entropic_inference_backend_t backend, const char *config_json)
Load a model from config (COLD → WARM).
Definition inference_c_api.cpp:207

entropic_inference_log_to_file
void entropic_inference_log_to_file(const char *path)
Redirect llama/ggml logs to a file.
Definition inference_c_api.cpp:682

entropic_inference_destroy
void entropic_inference_destroy(entropic_inference_backend_t backend)
Destroy backend instance and free all resources.
Definition inference_c_api.cpp:570

entropic_inference_free
void entropic_inference_free(void *ptr)
Free a string allocated by the inference backend.
Definition inference_c_api.cpp:582

entropic_inference_deactivate
entropic_error_t entropic_inference_deactivate(entropic_inference_backend_t backend)
Deactivate model (ACTIVE → WARM).
Definition inference_c_api.cpp:257

entropic_inference_state
int entropic_inference_state(entropic_inference_backend_t backend)
Query model state (lock-free).
Definition inference_c_api.cpp:297

entropic_inference_supports
int entropic_inference_supports(entropic_inference_backend_t backend, int capability)
Query backend capability.

entropic_inference_save_state
entropic_error_t entropic_inference_save_state(entropic_inference_backend_t backend, int seq_id, void **buffer, size_t *buffer_size)
Save model state for a sequence.

entropic_inference_generate_with_cancel
entropic_error_t entropic_inference_generate_with_cancel(entropic_inference_backend_t backend, const char *messages_json, const char *params_json, char **result_json, int *cancel_flag)
Generate a response (batch mode) with mid-decode cancellation.
Definition inference_c_api.cpp:437

entropic_inference_restore_state
entropic_error_t entropic_inference_restore_state(entropic_inference_backend_t backend, int seq_id, const void *buffer, size_t buffer_size)
Restore model state for a sequence.