entropic/interface__factory_8cpp_source.html

// SPDX-License-Identifier: Apache-2.0

#include <entropic/inference/interface_factory.h>

#include <entropic/inference/orchestrator.h>

#include <entropic/types/config.h>

#include <entropic/types/message.h>


#include <nlohmann/json.hpp>


#include <atomic>

#include <cstdlib>

#include <cstring>

#include <string>

#include <vector>


namespace entropic {


// ── Context struct for callbacks ───────────────────────────


struct InterfaceContext {

    ModelOrchestrator* orchestrator;

    std::string default_tier;

};


// ── JSON helpers ───────────────────────────────────────────


static std::vector<Message> parse_msgs(const char* json_str) {

    std::vector<Message> msgs;

    if (!json_str) { return msgs; }

    auto arr = nlohmann::json::parse(json_str, nullptr, false);

    if (!arr.is_array()) { return msgs; }

    for (const auto& obj : arr) {

        Message m;

        m.role = obj.value("role", "");

        m.content = obj.value("content", "");

        msgs.push_back(std::move(m));

    }

    return msgs;

}


static GenerationParams parse_params(const char* json_str) {

    GenerationParams p;

    if (!json_str) { return p; }

    auto j = nlohmann::json::parse(json_str, nullptr, false);

    if (!j.is_object()) { return p; }

    if (j.contains("max_tokens")) { p.max_tokens = j["max_tokens"]; }

    if (j.contains("temperature")) { p.temperature = j["temperature"]; }

    if (j.contains("grammar_key")) {

        p.grammar_key = j["grammar_key"].get<std::string>();

    }

    if (j.contains("enable_thinking")) {

        p.enable_thinking = j["enable_thinking"].get<bool>();

    }

    if (j.contains("top_p")) { p.top_p = j["top_p"]; }

    if (j.contains("top_k")) { p.top_k = j["top_k"]; }

    if (j.contains("repeat_penalty")) {

        p.repeat_penalty = j["repeat_penalty"];

    }

    if (j.contains("seed")) { p.seed = j["seed"].get<int>(); }

    return p;

}


static std::string extract_tier(const char* json_str,

                                const std::string& default_tier) {

    if (!json_str) { return default_tier; }

    auto j = nlohmann::json::parse(json_str, nullptr, false);

    if (j.is_object() && j.contains("tier")) {

        return j["tier"].get<std::string>();

    }

    return default_tier;

}


static char* dup(const std::string& s) {

    return strdup(s.c_str());

}


// ── C-callable wrappers ────────────────────────────────────


static int iface_generate(const char* msgs_json,

                          const char* params_json,

                          char** result_json,

                          void* user_data) {

    auto* ctx = static_cast<InterfaceContext*>(user_data);

    auto messages = parse_msgs(msgs_json);

    auto params = parse_params(params_json);

    auto tier = extract_tier(params_json, ctx->default_tier);

    auto result = ctx->orchestrator->generate(

        messages, params, tier);

    auto& out = result.raw_content.empty()

        ? result.content : result.raw_content;

    *result_json = dup(out);

    return 0;

}


static int iface_generate_stream(

    const char* msgs_json, const char* params_json,

    void (*on_token)(const char*, size_t, void*),

    void* token_ud, int* cancel, void* user_data) {

    auto* ctx = static_cast<InterfaceContext*>(user_data);

    auto messages = parse_msgs(msgs_json);

    auto params = parse_params(params_json);

    std::atomic<bool> cancel_flag(cancel && *cancel);

    auto cb = [on_token, token_ud](std::string_view tok) {

        on_token(tok.data(), tok.size(), token_ud);

    };

    auto tier = extract_tier(params_json, ctx->default_tier);

    ctx->orchestrator->generate_streaming(

        messages, params, cb, cancel_flag, tier);

    return 0;

}


static int iface_route(const char* msgs_json,

                       char** result_json, void* user_data) {

    auto* ctx = static_cast<InterfaceContext*>(user_data);

    auto messages = parse_msgs(msgs_json);

    auto tier = ctx->orchestrator->route(messages);

    *result_json = dup(tier);

    return 0;

}


static int iface_complete(const char* prompt,

                          const char* params_json,

                          char** result_json, void* user_data) {

    auto* ctx = static_cast<InterfaceContext*>(user_data);

    auto tier = extract_tier(params_json, ctx->default_tier);

    Message msg;

    msg.role = "user";

    msg.content = prompt;

    GenerationParams params{};

    params.max_tokens = 1;

    auto result = ctx->orchestrator->generate(

        {msg}, params, tier);

    *result_json = dup(result.content);

    return 0;

}


static int iface_parse_tool_calls(const char* raw,

                                  char** cleaned,

                                  char** tool_calls_json,

                                  void* user_data) {

    auto* ctx = static_cast<InterfaceContext*>(user_data);

    auto* adapter = ctx->orchestrator->get_adapter(ctx->default_tier);

    if (!adapter) {

        *cleaned = dup(raw ? raw : "");

        *tool_calls_json = dup("[]");

        return 0;

    }

    auto parsed = adapter->parse_tool_calls(raw ? raw : "");

    *cleaned = dup(parsed.cleaned_content);

    nlohmann::json arr = nlohmann::json::array();

    for (const auto& tc : parsed.tool_calls) {

        nlohmann::json args;

        for (const auto& [k, v] : tc.arguments) {

            auto parsed_val = nlohmann::json::parse(v, nullptr, false);

            args[k] = parsed_val.is_discarded()

                ? nlohmann::json(v) : parsed_val;

        }

        arr.push_back({{"name", tc.name}, {"arguments", args}});

    }

    *tool_calls_json = dup(arr.dump());

    return 0;

}


static int iface_is_complete(const char* /*content*/,

                             const char* tool_calls_json,

                             void* /*user_data*/) {

    if (!tool_calls_json) { return 1; }

    auto tc = nlohmann::json::parse(tool_calls_json, nullptr, false);

    return (tc.is_array() && !tc.empty()) ? 0 : 1;

}


// ── Factory ────────────────────────────────────────────────


InferenceInterface build_orchestrator_interface(

    ModelOrchestrator* orchestrator,

    const std::string& default_tier,

    InterfaceContext** out_context) {

    auto* ctx = new InterfaceContext{orchestrator, default_tier};

    if (out_context) { *out_context = ctx; }


    InferenceInterface iface;

    iface.generate = iface_generate;

    iface.generate_stream = iface_generate_stream;

    iface.route = iface_route;

    iface.complete = iface_complete;

    iface.parse_tool_calls = iface_parse_tool_calls;

    iface.is_response_complete = iface_is_complete;

    iface.free_fn = free;

    iface.backend_data = ctx;

    iface.orchestrator_data = ctx;

    iface.adapter_data = ctx;

    return iface;

}


void destroy_orchestrator_interface(InterfaceContext* context) {

    delete context;

}


} // namespace entropic

entropic::ModelOrchestrator
Multi-model lifecycle and routing orchestrator.
Definition orchestrator.h:71

entropic::ModelOrchestrator::get_adapter
ChatAdapter * get_adapter(const std::string &tier_name) const
Get adapter for a tier.
Definition orchestrator.cpp:930

config.h
Configuration structs with defaults.

interface_factory.h
Factory for building InferenceInterface from a ModelOrchestrator.

message.h
Message struct for conversation history.

entropic
Activate model on GPU (WARM → ACTIVE).
Definition bundled_models.h:20

entropic::iface_parse_tool_calls
static int iface_parse_tool_calls(const char *raw, char **cleaned, char **tool_calls_json, void *user_data)
Parse tool calls from raw model output via adapter.
Definition interface_factory.cpp:206

entropic::parse_msgs
static std::vector< Message > parse_msgs(const char *json_str)
Parse JSON message array into Message vector.
Definition interface_factory.cpp:49

entropic::parse_params
static GenerationParams parse_params(const char *json_str)
Parse generation params from JSON string.
Definition interface_factory.cpp:70

entropic::iface_is_complete
static int iface_is_complete(const char *, const char *tool_calls_json, void *)
Check if response is complete (no pending tool calls).
Definition interface_factory.cpp:238

entropic::iface_generate
static int iface_generate(const char *msgs_json, const char *params_json, char **result_json, void *user_data)
Generate via orchestrator.
Definition interface_factory.cpp:128

entropic::iface_route
static int iface_route(const char *msgs_json, char **result_json, void *user_data)
Route messages to tier via orchestrator.
Definition interface_factory.cpp:171

entropic::extract_tier
static std::string extract_tier(const char *json_str, const std::string &default_tier)
Extract tier name from params JSON, falling back to default.
Definition interface_factory.cpp:100

entropic::destroy_orchestrator_interface
void destroy_orchestrator_interface(InterfaceContext *context)
Free a context returned by build_orchestrator_interface().
Definition interface_factory.cpp:282

entropic::iface_generate_stream
static int iface_generate_stream(const char *msgs_json, const char *params_json, void(*on_token)(const char *, size_t, void *), void *token_ud, int *cancel, void *user_data)
Streaming generate via orchestrator.
Definition interface_factory.cpp:149

entropic::iface_complete
static int iface_complete(const char *prompt, const char *params_json, char **result_json, void *user_data)
Raw text completion via orchestrator.
Definition interface_factory.cpp:185

entropic::dup
static char * dup(const std::string &s)
Heap-allocate a C string copy.
Definition interface_factory.cpp:117

entropic::build_orchestrator_interface
InferenceInterface build_orchestrator_interface(ModelOrchestrator *orchestrator, const std::string &default_tier, InterfaceContext **out_context)
Build an InferenceInterface wired to an orchestrator.
Definition interface_factory.cpp:256

orchestrator.h
ModelOrchestrator — multi-model lifecycle and routing.

entropic::GenerationParams
Generation parameters for a single inference call.
Definition config.h:227

entropic::GenerationParams::top_k
int top_k
Top-K sampling.
Definition config.h:230

entropic::GenerationParams::repeat_penalty
float repeat_penalty
Repetition penalty.
Definition config.h:231

entropic::GenerationParams::temperature
float temperature
Sampling temperature.
Definition config.h:228

entropic::GenerationParams::grammar_key
std::string grammar_key
Grammar registry key.
Definition config.h:245

entropic::GenerationParams::enable_thinking
bool enable_thinking
Enable <think> blocks (false if reasoning_budget == 0)
Definition config.h:239

entropic::GenerationParams::max_tokens
int max_tokens
Maximum tokens to generate.
Definition config.h:232

entropic::GenerationParams::top_p
float top_p
Nucleus sampling threshold.
Definition config.h:229

entropic::GenerationParams::seed
int seed
RNG seed for reproducible sampling.
Definition config.h:237

entropic::InterfaceContext
Holds orchestrator + tier for C callback user_data.
Definition interface_factory.cpp:35

entropic::InterfaceContext::orchestrator
ModelOrchestrator * orchestrator
Orchestrator pointer.
Definition interface_factory.cpp:36

entropic::InterfaceContext::default_tier
std::string default_tier
Default tier name.
Definition interface_factory.cpp:37

entropic::Message
A message in a conversation.
Definition message.h:35

entropic::Message::content
std::string content
Message text content (always populated)
Definition message.h:37

entropic::Message::role
std::string role
Message role.
Definition message.h:36