entropic/compaction_8cpp_source.html

// SPDX-License-Identifier: Apache-2.0

#include <entropic/core/compaction.h>

#include <entropic/core/engine_types.h>

#include <entropic/types/logging.h>


#include <sstream>


static auto logger = entropic::log::get("core.compaction");


namespace entropic {


// ── TokenCounter ─────────────────────────────────────────


TokenCounter::TokenCounter(int max_tokens)

    : max_tokens(max_tokens) {}


int TokenCounter::count_text(const std::string& text) {

    if (text.empty()) {

        return 0;

    }

    return static_cast<int>(text.size()) / 4 + 1;

}


int TokenCounter::count_message(const Message& msg) const {

    const auto* key = static_cast<const void*>(&msg);

    auto it = cache_.find(key);

    if (it != cache_.end()) {

        return it->second;

    }

    int count = count_text(msg.content) + 4; // +4 for role tokens

    cache_[key] = count;

    return count;

}


int TokenCounter::count_messages(

    const std::vector<Message>& messages) const {

    int total = 0;

    for (const auto& msg : messages) {

        total += count_message(msg);

    }

    return total;

}


float TokenCounter::usage_percent(

    const std::vector<Message>& messages) const {

    if (max_tokens == 0) {

        return 0.0f;

    }

    return static_cast<float>(count_messages(messages))

         / static_cast<float>(max_tokens);

}


void TokenCounter::clear_cache() {

    cache_.clear();

}


// ── CompactionManager ────────────────────────────────────


CompactionManager::CompactionManager(

    const CompactionConfig& config,

    TokenCounter& counter)

    : config(config), counter(counter) {}


CompactionResult CompactionManager::check_and_compact(

    std::vector<Message>& messages,

    bool force,

    const std::string& conversation_id) {

    int current = counter.count_messages(messages);

    int threshold = static_cast<int>(

        static_cast<float>(counter.max_tokens) * config.threshold_percent);


    if (!force && current < threshold) {

        return {false, current, current};

    }


    if (!config.enabled) {

        logger->warn("Context at {}/{} tokens, compaction disabled",

                     current, counter.max_tokens);

        return {false, current, current};

    }


    logger->info("Compacting conversation ({} tokens)", current);


    // Save full history before compacting (v1.8.8)

    if (config.save_full_history && !conversation_id.empty()) {

        save_snapshot(conversation_id, messages);

    }


    std::string summary;

    int stripped = 0;

    auto compacted = compact(messages, summary, stripped);


    counter.clear_cache();

    int new_count = counter.count_messages(compacted);


    if (new_count >= current) {

        logger->error("Compaction did not reduce tokens: {} -> {}",

                      current, new_count);

    }


    logger->info("Compacted {} -> {} tokens", current, new_count);

    messages = std::move(compacted);


    CompactionResult result;

    result.compacted = true;

    result.old_token_count = current;

    result.new_token_count = new_count;

    result.summary = summary;

    result.preserved_messages = static_cast<int>(messages.size()) - 1;

    result.messages_summarized = stripped;

    return result;

}


static void partition_messages(const std::vector<Message>& messages,

                               size_t start,

                               std::vector<const Message*>& user_msgs,

                               std::vector<const Message*>& assistant_msgs,

                               int& stripped_count) {

    stripped_count = 0;

    for (size_t i = start; i < messages.size(); ++i) {

        const auto& msg = messages[i];

        auto src = msg.metadata.find("source");

        if (src != msg.metadata.end() && src->second == "user") {

            user_msgs.push_back(&msg);

        } else if (msg.role == "assistant") {

            assistant_msgs.push_back(&msg);

        } else {

            ++stripped_count;

        }

    }

}


static std::vector<Message> assemble_compacted(

    const Message* system_msg, Message summary_msg,

    const std::vector<const Message*>& user_msgs,

    const std::vector<const Message*>& assistant_msgs) {

    std::vector<Message> result;

    if (system_msg != nullptr) { result.push_back(*system_msg); }

    result.push_back(std::move(summary_msg));

    for (const auto* m : user_msgs) { result.push_back(*m); }

    if (!assistant_msgs.empty()) {

        result.push_back(*assistant_msgs.back());

    }

    return result;

}


std::vector<Message> CompactionManager::compact(

    const std::vector<Message>& messages,

    std::string& summary,

    int& stripped_count) {

    Message const* system_msg = nullptr;

    size_t start = 0;

    if (!messages.empty() && messages[0].role == "system") {

        system_msg = &messages[0];

        start = 1;

    }


    std::vector<const Message*> user_msgs;

    std::vector<const Message*> assistant_msgs;

    partition_messages(messages, start, user_msgs, assistant_msgs,

                       stripped_count);


    std::vector<Message> working(messages.begin() + static_cast<long>(start),

                                 messages.end());

    logger->info("Compact: {} user, {} assistant, {} stripped",

                 user_msgs.size(), assistant_msgs.size(), stripped_count);

    summary = structured_summary(working);

    Message summary_msg;

    summary_msg.role = "user";

    summary_msg.content = format_summary(

        summary, static_cast<int>(working.size()));


    return assemble_compacted(system_msg, std::move(summary_msg),

                              user_msgs, assistant_msgs);

}


std::string CompactionManager::structured_summary(

    const std::vector<Message>& messages) {

    std::string lines = "Original task: "

                      + extract_original_task(messages);


    auto tool_log = extract_tool_log(messages);

    if (!tool_log.empty()) {

        lines += "\n\nTool calls made (oldest first):";

        for (const auto& [name, brief] : tool_log) {

            lines += "\n- " + name + ": " + brief;

        }

    }

    return lines;

}


static bool is_tool_result(const Message& msg) {

    if (msg.content.rfind("Tool `", 0) == 0) { return true; }

    auto src = msg.metadata.find("source");

    return src != msg.metadata.end() && src->second == "tool";

}


static std::string find_tagged(

    const std::vector<Message>& messages,

    const std::string& source) {

    for (const auto& msg : messages) {

        auto src = msg.metadata.find("source");

        if (src != msg.metadata.end() && src->second == source) {

            return msg.content;

        }

    }

    return {};

}


static std::string find_first_user_task(

    const std::vector<Message>& messages) {

    for (const auto& msg : messages) {

        if (msg.role != "user" || msg.content.empty()) { continue; }

        if (is_tool_result(msg)) { continue; }

        return msg.content;

    }

    return {};

}


std::string CompactionManager::extract_original_task(

    const std::vector<Message>& messages) {

    std::string task = find_tagged(messages, "user");

    if (task.empty()) { task = find_first_user_task(messages); }

    if (task.empty()) { return "(no user message found)"; }

    if (task.size() > 500) { return task.substr(0, 500) + "..."; }

    return task;

}


std::vector<std::pair<std::string, std::string>>

CompactionManager::extract_tool_log(

    const std::vector<Message>& messages) {

    std::vector<std::pair<std::string, std::string>> log;

    for (const auto& msg : messages) {

        auto it = msg.metadata.find("tool_name");

        if (it == msg.metadata.end()) {

            continue;

        }

        const auto& name = it->second;

        if (msg.content.rfind("[Previous:", 0) == 0) {

            log.emplace_back(name, "(pruned)");

            continue;

        }

        auto nl = msg.content.find('\n');

        std::string brief = msg.content.substr(0, std::min(nl, size_t{100}));

        log.emplace_back(name, brief);

    }

    return log;

}


std::string CompactionManager::format_summary(

    const std::string& summary,

    int message_count) {

    return "[CONVERSATION SUMMARY]\n"

           "The following summarizes "

         + std::to_string(message_count)

         + " previous messages that have been compacted"

           " to save context space.\n\n"

         + summary

         + "\n\n[END SUMMARY - Recent conversation continues below]";

}


CompactionResult CompactionManager::compact_messages(

    const std::vector<Message>& messages) {

    int old_count = counter.count_messages(messages);


    std::string summary;

    int stripped = 0;

    auto compacted = compact(messages, summary, stripped);


    counter.clear_cache();

    int new_count = counter.count_messages(compacted);


    CompactionResult result;

    result.compacted = true;

    result.old_token_count = old_count;

    result.new_token_count = new_count;

    result.summary = summary;

    result.preserved_messages =

        static_cast<int>(compacted.size()) - 1;

    result.messages_summarized = stripped;

    result.messages = compacted;

    result.compactor_source = "default";

    return result;

}


void CompactionManager::set_storage(const StorageInterface* storage) {

    storage_ = storage;

}


static std::string json_escape(const std::string& input) {

    std::ostringstream oss;

    for (char c : input) {

        if (c == '"') oss << "\\\"";

        else if (c == '\\') oss << "\\\\";

        else if (c == '\n') oss << "\\n";

        else oss << c;

    }

    return oss.str();

}


static std::string serialize_messages_json(

        const std::vector<Message>& messages) {

    std::ostringstream oss;

    oss << '[';

    for (size_t i = 0; i < messages.size(); ++i) {

        if (i > 0) oss << ',';

        oss << "{\"role\":\"" << messages[i].role

            << "\",\"content\":\"" << json_escape(messages[i].content)

            << "\"}";

    }

    oss << ']';

    return oss.str();

}


void CompactionManager::save_snapshot(

    const std::string& conversation_id,

    const std::vector<Message>& messages) {

    if (!storage_ || !storage_->save_snapshot) {

        return;

    }


    auto json_str = serialize_messages_json(messages);

    storage_->save_snapshot(

        conversation_id.c_str(), json_str.c_str(),

        storage_->user_data);

    logger->info("Saved compaction snapshot for {} ({} messages)",

                 conversation_id, messages.size());

}


} // namespace entropic

entropic::CompactionManager::compact_messages
CompactionResult compact_messages(const std::vector< Message > &messages)
Compact messages using the value-density strategy.
Definition compaction.cpp:428

entropic::CompactionManager::config
CompactionConfig config
Compaction configuration.
Definition compaction.h:157

entropic::CompactionManager::counter
TokenCounter & counter
Shared token counter.
Definition compaction.h:158

entropic::CompactionManager::check_and_compact
CompactionResult check_and_compact(std::vector< Message > &messages, bool force=false, const std::string &conversation_id="")
Check if compaction is needed and perform if so.
Definition compaction.cpp:124

entropic::CompactionManager::set_storage
void set_storage(const struct StorageInterface *storage)
Set storage interface for compaction snapshots.
Definition compaction.cpp:458

entropic::CompactionManager::CompactionManager
CompactionManager(const CompactionConfig &config, TokenCounter &counter)
Construct a compaction manager.
Definition compaction.cpp:111

entropic::TokenCounter
Track token usage across conversation.
Definition compaction.h:32

entropic::TokenCounter::max_tokens
int max_tokens
Maximum context window size.
Definition compaction.h:71

entropic::TokenCounter::clear_cache
void clear_cache()
Clear the token count cache.
Definition compaction.cpp:98

entropic::TokenCounter::count_messages
int count_messages(const std::vector< Message > &messages) const
Count total tokens in a message list.
Definition compaction.cpp:68

entropic::TokenCounter::usage_percent
float usage_percent(const std::vector< Message > &messages) const
Get usage as fraction of context window (0.0–1.0).
Definition compaction.cpp:84

entropic::TokenCounter::TokenCounter
TokenCounter(int max_tokens)
Construct a token counter.
Definition compaction.cpp:26

entropic::TokenCounter::count_message
int count_message(const Message &msg) const
Count tokens in a single message.
Definition compaction.cpp:50

compaction.h
Auto-compaction for context management.

engine_types.h
Types for the agentic loop engine.

logging.h
spdlog initialization and logger access.

entropic::log::get
ENTROPIC_EXPORT std::shared_ptr< spdlog::logger > get(const std::string &name)
Get or create a named logger.
Definition logging.cpp:211

entropic
Activate model on GPU (WARM → ACTIVE).
Definition bundled_models.h:20

entropic::find_tagged
static std::string find_tagged(const std::vector< Message > &messages, const std::string &source)
Find the first message matching a source tag.
Definition compaction.cpp:316

entropic::assemble_compacted
static std::vector< Message > assemble_compacted(const Message *system_msg, Message summary_msg, const std::vector< const Message * > &user_msgs, const std::vector< const Message * > &assistant_msgs)
Assemble the compacted list: system, summary, users, last asst.
Definition compaction.cpp:213

entropic::partition_messages
static void partition_messages(const std::vector< Message > &messages, size_t start, std::vector< const Message * > &user_msgs, std::vector< const Message * > &assistant_msgs, int &stripped_count)
Partition messages (from start) into user/assistant/stripped.
Definition compaction.cpp:184

entropic::serialize_messages_json
static std::string serialize_messages_json(const std::vector< Message > &messages)
Serialize messages to minimal JSON array.
Definition compaction.cpp:494

entropic::is_tool_result
static bool is_tool_result(const Message &msg)
Extract original user task from messages.
Definition compaction.cpp:302

entropic::json_escape
static std::string json_escape(const std::string &input)
Save pre-compaction snapshot via storage interface.
Definition compaction.cpp:476

entropic::find_first_user_task
static std::string find_first_user_task(const std::vector< Message > &messages)
Find the first user-role message that isn't a tool result.
Definition compaction.cpp:335

entropic::CompactionConfig
Auto-compaction configuration.
Definition config.h:508

entropic::CompactionConfig::save_full_history
bool save_full_history
Save full history before compaction.
Definition config.h:514

entropic::CompactionConfig::threshold_percent
float threshold_percent
Compaction trigger (0.5–0.99)
Definition config.h:510

entropic::CompactionConfig::enabled
bool enabled
Enable auto-compaction.
Definition config.h:509

entropic::CompactionResult
Result of a compaction operation.
Definition compaction.h:89

entropic::CompactionResult::messages_summarized
int messages_summarized
Messages stripped into summary.
Definition compaction.h:95

entropic::CompactionResult::summary
std::string summary
Generated summary text.
Definition compaction.h:93

entropic::CompactionResult::messages
std::vector< Message > messages
The compacted message list (v1.9.9)
Definition compaction.h:96

entropic::CompactionResult::preserved_messages
int preserved_messages
Messages kept after compaction.
Definition compaction.h:94

entropic::CompactionResult::old_token_count
int old_token_count
Token count before compaction.
Definition compaction.h:91

entropic::CompactionResult::new_token_count
int new_token_count
Token count after compaction.
Definition compaction.h:92

entropic::CompactionResult::compacted
bool compacted
Whether compaction occurred.
Definition compaction.h:90

entropic::CompactionResult::compactor_source
std::string compactor_source
"default", "global_custom", or identity name
Definition compaction.h:100

entropic::Message
A message in a conversation.
Definition message.h:35

entropic::Message::metadata
std::unordered_map< std::string, std::string > metadata
Arbitrary metadata.
Definition message.h:39

entropic::Message::content
std::string content
Message text content (always populated)
Definition message.h:37

entropic::StorageInterface
Storage interface for conversation persistence.
Definition engine_types.h:402

entropic::StorageInterface::save_snapshot
bool(* save_snapshot)(const char *conversation_id, const char *messages_json, void *user_data)
Save a compaction snapshot (full history before compaction).
Definition engine_types.h:427

entropic::StorageInterface::user_data
void * user_data
Opaque pointer (storage backend)
Definition engine_types.h:491