RESEARCH RECORD · 2026.05

論理ゲートだけで
Transformer を超えてみた

GPU を一切使わず、AND・OR・XOR などの論理ゲートだけで言語モデルを作る。
失敗 3 回、設計の根本見直し、そして知識蒸留で逆転。
char-level TinyShakespeare 80KB での実証記録。

TRANSFORMER · BASELINE
4.86
vs
BOOLEAN HBA · DISTILLED
4.73

研究の全工程、3 分で

失敗を繰り返しながら、論理回路だけで Transformer を超えるまでの道筋。

QUESTION

そもそも float って必要?

AI は GPU 並列の float 積和に依存する。論理ゲートだけで作れたら、CPU で爆速、消費電力激減、組み込みでも巨大 LM が動く。

FOUNDATION

DLGN で勾配を流す

論理ゲートは離散関数で勾配が流れない。16 種類のゲートを softmax で混合 し勾配を流す。学習後は argmax で純 Boolean に確定。

FAILURE 01

DLGN flat は届かなかった

素直に 4 段積んで TinyShakespeare 学習 → 論理回路で言語学習は 成功。だが Transformer には届かず。

11.83SOFT PPL · TF=4.86
FAILURE 02

LoopedDLGN で散る

Universal Transformer × Boolean。バナッハの不動点定理で美しい設計のはずが、量子化誤差が反復で 爆発

754.31HARD PPL · 構造的に詰む
BREAKTHROUGH

HBA で発想を変える

Attention を ルーター値の集約 に分解。ルーターだけ Boolean、値は float のまま。誤差が深さ方向に伝播しない。

5.32SOFT PPL · HBA v2
CHECKMATE

知識蒸留で逆転

教師 Transformer → 生徒 HBA に蒸留。Born-again 効果で、論理回路の生徒が教師を 0.13 上回る

4.73SOFT PPL · TF を逆転

結果一覧

TinyShakespeare 80KB / char-level / vocab=61 / 計算機 RTX 4060.

Model Soft PPL Hard PPL Note
Transformer (baseline) 4.86 比較対象
DLGN flat 11.83 15.16 純 Boolean で言語学習に成功
LoopedDLGN v1 11.05 754.31 量子化誤差が反復で爆発
HBA v1 5.40 → 9.75 TF まで 0.54 差、後半過学習
HBA v2 (stable) 5.32 6.54 Best ckpt + Early stop + Hard 校正
HBA Distilled (Student) 4.73 6.31 Transformer を 0.13 上回る
ChatHBA 6.46 数値は出るが会話崩壊

続きを読む

THEORY

理論編 — 数式と設計

DLGN の微分可能化、HBA の数学的構造、蒸留損失の組み立て方。実装に直結する式まで踏み込んで解説。

EXPERIMENT

実験編 — 全ログと考察

4 つの実験と 3 つの失敗、最終的な逆転までの全データ。学習曲線、ハマったポイント、温度整合性のバグ修正まで。

CHAT

チャット編 — ChatHBA 崩壊記

研究での成功に味を占めて会話モデルに挑戦 → 完全崩壊。PPL は良いのに会話は崩れる現象の構造的理由。


関連リンク

GITHUB

ソースコード + 実験ログ

本研究の全実装と、学習済みモデル、生成 Q&A コーパス、実験ログを公開。MIT ライセンス。

YOUTUBE

かるまるラボ チャンネル

本研究を約 5 分にまとめた解説動画。ナレーション: ずんだもん / 編集: FrameScript (自作の動画エディタ)。