MENU
  • IT導入・業務効率化
    • 在庫管理
    • IT導入補助金
  • WEB制作・開発
    • Web制作挑戦Web制作に関連する情報
    • webコーダー挑戦
    • Webデザイナー挑戦デザイナーがWebデザイナーに挑戦し、コーディングやデザインマターでの困りごとや調査内容、他の専門家との情報交換等を投稿します。
    • コーディングメモ
    • エンジニア技術MEMO
    • コーダー技術MEMO
    • セキュリティ
  • IT TOOL一覧
    • ECサイトIT TOOL ECサイト
    • アピス在庫管理
    • クラウドファンディング
    • セルフオーダーシステム
    • レッスン施術サービスレッスン施術サービス予約サイト
    • シンプルクラウドソーシング
    • 会議室予約
    • ShopifyShopifyに関連する設定などさまざまな投稿をしていきます。
  • ビジネス支援ツール
    • Canva
    • WordpressWordpressのサイト構築あれこれ!
    • ZOOM
    • エクセル・ワード
    • バーコード
  • このブランドはどこの国?|
  • テクノロジー・トレンド
    • スマートガジェット
      • イヤホン
      • スマホ・PC・タブレット
  • デザインチーム
  • マーケティング・ブログ運営
    • SEO・ブログ改善
    • アクセス解析
    • ブログ運営
    • ブログ収益化
    • プロンプト
    • マーケティング全般
  • ライフスタイル・健康
    • PC関連ネットで販売するPC関連商品の説明
    • トランプ高関税
  • お知らせ
技術が生活を楽にする
tecn
    • IT導入・業務効率化
      • 在庫管理
      • IT導入補助金
    • WEB制作・開発
      • Web制作挑戦Web制作に関連する情報
      • webコーダー挑戦
      • Webデザイナー挑戦デザイナーがWebデザイナーに挑戦し、コーディングやデザインマターでの困りごとや調査内容、他の専門家との情報交換等を投稿します。
      • コーディングメモ
      • エンジニア技術MEMO
      • コーダー技術MEMO
      • セキュリティ
    • IT TOOL一覧
      • ECサイトIT TOOL ECサイト
      • アピス在庫管理
      • クラウドファンディング
      • セルフオーダーシステム
      • レッスン施術サービスレッスン施術サービス予約サイト
      • シンプルクラウドソーシング
      • 会議室予約
      • ShopifyShopifyに関連する設定などさまざまな投稿をしていきます。
    • ビジネス支援ツール
      • Canva
      • WordpressWordpressのサイト構築あれこれ!
      • ZOOM
      • エクセル・ワード
      • バーコード
    • このブランドはどこの国?|
    • テクノロジー・トレンド
      • スマートガジェット
        • イヤホン
        • スマホ・PC・タブレット
    • デザインチーム
    • マーケティング・ブログ運営
      • SEO・ブログ改善
      • アクセス解析
      • ブログ運営
      • ブログ収益化
      • プロンプト
      • マーケティング全般
    • ライフスタイル・健康
      • PC関連ネットで販売するPC関連商品の説明
      • トランプ高関税
    • お知らせ
tecn
    • IT導入・業務効率化
      • 在庫管理
      • IT導入補助金
    • WEB制作・開発
      • Web制作挑戦Web制作に関連する情報
      • webコーダー挑戦
      • Webデザイナー挑戦デザイナーがWebデザイナーに挑戦し、コーディングやデザインマターでの困りごとや調査内容、他の専門家との情報交換等を投稿します。
      • コーディングメモ
      • エンジニア技術MEMO
      • コーダー技術MEMO
      • セキュリティ
    • IT TOOL一覧
      • ECサイトIT TOOL ECサイト
      • アピス在庫管理
      • クラウドファンディング
      • セルフオーダーシステム
      • レッスン施術サービスレッスン施術サービス予約サイト
      • シンプルクラウドソーシング
      • 会議室予約
      • ShopifyShopifyに関連する設定などさまざまな投稿をしていきます。
    • ビジネス支援ツール
      • Canva
      • WordpressWordpressのサイト構築あれこれ!
      • ZOOM
      • エクセル・ワード
      • バーコード
    • このブランドはどこの国?|
    • テクノロジー・トレンド
      • スマートガジェット
        • イヤホン
        • スマホ・PC・タブレット
    • デザインチーム
    • マーケティング・ブログ運営
      • SEO・ブログ改善
      • アクセス解析
      • ブログ運営
      • ブログ収益化
      • プロンプト
      • マーケティング全般
    • ライフスタイル・健康
      • PC関連ネットで販売するPC関連商品の説明
      • トランプ高関税
    • お知らせ
  1. ホーム
  2. 未分類
  3. TECN内部リンク抽出GAS 仕様書 V0.2

TECN内部リンク抽出GAS 仕様書 V0.2

2026 6/04
未分類
2026年6月4日

仕様のURL: 

https://tecn.apice-tec.co.jp/tecn%e5%86%85%e9%83%a8%e3%83%aa%e3%83%b3%e3%82%af%e6%8a%bd%e5%87%bagas-%e4%bb%95%e6%a7%98%e6%9b%b8-v0-1/
目次

1. 目的

TECN記事台帳に登録されている各記事URLをもとに、公開HTMLを取得し、記事内に存在する内部リンクを抽出する。

取得した内部リンクは、専用シートに一覧化し、以下を把握できるようにする。

  • どの記事からどの記事へリンクしているか
  • どの見出し配下からリンクしているか
  • アンカーテキストは何か
  • ピラー記事、クラスター記事、無料DL記事への導線が足りているか
  • 孤立記事や被リンク不足の記事を発見できるか

2. GASの位置づけ

本GASは、記事台帳に付属するGASではなく、独立GASとして作成する。

対象スプレッドシートIDをGAS内またはスクリプトプロパティに定義し、TECN記事台帳スプレッドシートを外部参照する。

3. 対象スプレッドシート

対象:TECN記事台帳
対象シート名:記事台帳

記事台帳の主な項目:

  • 記事ID
  • 記事タイトル
  • URL
  • ページパス
  • スラッグ
  • 主カテゴリ
  • 従カテゴリ
  • 公開日
  • 更新日
  • 状態
  • 最終確認日
  • 備考
  • 従カテゴリー2
  • 最新PV

4. 抽出対象記事

記事台帳シートのうち、以下の条件を満たす行を対象とする。

  • URLが空白ではない
  • 状態が Publish
  • URLが https://tecn.apice-tec.co.jp/ で始まる
  • 取得対象件数は初期仕様では最大300件

将来的には、主カテゴリ単位で以下のように絞り込み可能にする。

  • 在庫管理のみ
  • ダイソーのみ
  • LDAC-blueのみ
  • WORDPRESSのみ
  • 全記事

5. HTML取得方法

各記事URLに対して、GASの UrlFetchApp.fetch() を使用して公開HTMLを取得する。

取得するのはWordPress編集画面のブロックHTMLではなく、実際に公開ページとして出力されているHTMLとする。

これにより、以下のリンクも取得対象に含める。

  • 本文内リンク
  • カスタムHTMLリンク
  • ブログパーツ内リンク
  • 関連記事リンク
  • ショートコード展開後のリンク
  • テーマ側で出力されたリンク

6. 抽出対象リンク

HTML内の <a href=""> を抽出する。

ただし、初期仕様では以下の内部リンクのみを対象とする。

  • https://tecn.apice-tec.co.jp/ で始まるリンク
  • /xxx のような相対パスで、TECN内部リンクと判断できるリンク

除外候補:

  • 外部サイト
  • # だけのページ内リンク
  • mailto:
  • tel:
  • 画像ファイル
  • CSS / JS / feed
  • 管理画面URL
  • カテゴリ一覧URL
  • タグ一覧URL
  • プライバシーポリシー
  • お問い合わせページ

除外条件は初期実装後に調整する。

7. 見出し判定

HTMLを上から順番に読み、直前に出現したH2またはH3を現在見出しとして保持する。

リンクが出現した時点で、直前のH2/H3をリンク元見出しとして記録する。

記録する見出し情報:

  • 見出しレベル
  • 見出しテキスト

例:

H2「SKUとJANの違いとは?」のあとに内部リンクが出た場合、そのリンクはこのH2配下のリンクとして記録する。

8. 出力シート

新規シート名:内部リンク抽出

出力項目:

  1. 取得日時
  2. FROM記事ID
  3. FROMタイトル
  4. FROM URL
  5. FROMページパス
  6. FROM主カテゴリ
  7. FROM従カテゴリ
  8. FROM従カテゴリー2
  9. FROM最新PV
  10. 見出しレベル
  11. 見出しテキスト
  12. TO URL
  13. TOページパス
  14. TO記事ID
  15. TOタイトル
  16. TO主カテゴリ
  17. TO従カテゴリ
  18. TO従カテゴリー2
  19. アンカーテキスト
  20. リンク種別
  21. nofollow
  22. target
  23. HTTPステータス
  24. 備考

9. TO記事情報の照合

抽出したTO URLからページパスを作成し、記事台帳のページパスと照合する。

一致した場合は、TO記事情報として以下を補完する。

  • TO記事ID
  • TOタイトル
  • TO主カテゴリ
  • TO従カテゴリ
  • TO従カテゴリー2

一致しない場合は、TO記事IDなどは空白にし、備考に「記事台帳未登録」と記録する。

10. リンク種別

初期仕様では自動判定は簡易的に行う。

候補:

  • 本文リンク
  • ブログパーツ候補
  • 関連記事候補
  • メニュー・フッター候補
  • 不明

ただし、初期実装では「不明」でもよい。
まずは内部リンク全体を取得することを優先する。

11. 実行単位

初期仕様では、1回の実行で最大300記事まで処理する。

将来的には以下を検討する。

  • 前回処理済み行の続きから再開
  • 主カテゴリ指定実行
  • URL指定実行
  • エラー行のみ再実行
  • 取得済みHTMLキャッシュ

12. エラー処理

HTML取得時にエラーが発生した場合も、処理全体は停止しない。

記録する内容:

  • HTTP 404
  • HTTP 403
  • fetch失敗
  • タイムアウト
  • HTML取得不可
  • リンクなし

エラーは内部リンク抽出シートの備考欄に記録する。

13. 初期実装の優先順位

第1段階:

  • 記事台帳を読む
  • Publish記事のURLを取得
  • 公開HTMLを取得
  • 内部リンクを抽出
  • 見出しレベル・見出しテキストを記録
  • 内部リンク抽出シートに出力

第2段階:

  • TO URLを記事台帳と照合
  • TO記事ID、TOタイトル、TOカテゴリを補完

第3段階:

  • 被リンク数集計
  • 発リンク数集計
  • ピラーへのリンク数集計
  • 無料DLページへのリンク数集計
  • 孤立記事一覧作成

14. 最終目的

TECN全体の内部リンク構造を可視化し、以下の改善に活用する。

  • TECNトップから各主カテゴリへの導線整理
  • 在庫管理ピラーへの内部リンク強化
  • SKU、バーコード、ピッキング、使用期限、棚番、在庫分析などのサブクラスター強化
  • STOCKmini、STEPmini、アピスmini無料DLへの導線強化
  • 2026年12月時点で月10〜30件の無料DL獲得を目指す

tecn内部リンク抽出   シート:カラム定義 確定版

列項目名内容
A取得日時HTMLを取得した日時
BFROM記事IDリンク元の記事ID
CFROMタイトルリンク元の記事タイトル
DFROM URLリンク元URL
EFROMページパスリンク元ページパス
FFROM主カテゴリリンク元の主カテゴリ
GFROM従カテゴリリンク元の従カテゴリ
HFROM従カテゴリー2リンク元の従カテゴリー2
IFROM最新PVリンク元記事の最新PV
J見出しレベルH2 / H3 / 見出し外
K見出しテキストリンクが出現した直前の見出し
LTO URLリンク先URL
MTOページパスリンク先ページパス
NTO記事ID記事台帳と照合したリンク先記事ID
OTOタイトル記事台帳と照合したリンク先タイトル
PTO主カテゴリリンク先の主カテゴリ
QTO従カテゴリリンク先の従カテゴリ
RTO従カテゴリー2リンク先の従カテゴリー2
Sアンカーテキストリンクに表示されている文字
Tリンク種別本文リンク / ブログパーツ候補 / 関連記事候補 / メニュー候補 / 不明
Unofollowrelにnofollowがあるか
Vtargettarget属性
WHTTPステータスFROM記事取得時のHTTPステータス
X備考記事台帳未登録・除外候補・取得エラーなど

同一記事内に同じTO URLが複数回出現した場合でも、
出現したリンクごとに1行ずつ記録する。

同じリンク先でも、
どの見出し配下にあるか
どんなアンカーテキストか
本文中か記事末尾か
によって意味が違うため。

スクリプトプロパティ  TECN_LEDGER_URL   ここにtecn記事台帳のURLを入れておきます。 

TECN_LEDGER_URL
TECN_LEDGER_SHEET_ID

スクリプトプロパティ 記載から抽出方法

■ スクリプトプロパティ

TECN_LEDGER_URL

TECN記事台帳のURLまたは
スプレッドシートIDを設定する。

■ 初期設定

setupTecnLedgerSpreadsheetUrl()

を実行する。

URLからスプレッドシートIDを抽出し、

TECN_LEDGER_SHEET_ID

へ保存する。

以後の処理は
TECN_LEDGER_SHEET_ID
を利用する。

V0.2 変更仕様

15. V0.2 本文外リンク除外処理

15-1. 目的

V0.1では公開HTMLから内部リンクを取得するため、本文以外の以下の領域も内部リンクとして取得される。

  • 筆者プロフィール
  • 関連記事
  • コメント欄
  • 最近の投稿
  • アーカイブ

これらはサイト共通パーツやWordPress標準機能によるリンクであり、クラスター設計や内部リンク戦略の分析ノイズとなる。

そのためV0.2では、V0.1で作成された「tecn内部リンク抽出」シートに対して後処理を実施し、本文分析に不要なリンク行を除外する。


15-2. 処理対象シート

対象シート

tecn内部リンク抽出

15-3. 判定列

対象列

K列(見出しテキスト)

15-4. 処理開始条件

K列に以下の文字列が出現した場合、

筆者プロフィール|DXジュン(Apice Technology 代表)

以降を本文外領域とみなす。


15-5. 削除対象

本文外領域において、K列が以下の文字列と一致する行を削除対象とする。

関連記事

コメントする コメントをキャンセル

最近の投稿

アーカイブ

15-6. アーカイブ到達後の処理

K列で

アーカイブ

を検出した時点で、その記事の本文外領域の解析は終了する。

以降の行は分析対象外として扱い、次の

筆者プロフィール|DXジュン(Apice Technology 代表)

が出現するまで読み飛ばす。

セカンドパス V0.2: cleanupTecnInternalLinksV02()

記事末尾での、サイドメニュ周りのリンクを外します。 


15-7. 実行タイミング

V0.1の内部リンク抽出完了後に実行する。

処理フロー

runExtractTecnInternalLinks()

↓

tecn内部リンク抽出 作成

↓

cleanupTecnInternalLinksV02()

↓

本文分析用データ完成

15-8. 削除方式

初期実装では対象行を物理削除する。

対象行はシート下部から順番に削除することで行番号ずれを防止する。


15-9. 期待効果

V0.1では以下が混在する。

本文リンク

ブログパーツ

関連記事

最近の投稿

アーカイブ

コメント関連リンク

V0.2実施後は主に

本文リンク

ブログパーツ

ピラーページリンク

無料DL導線

関連記事(本文内設置)

のみが残る。

これにより、

  • クラスター設計分析
  • 被リンク分析
  • 発リンク分析
  • STOCKmini導線分析
  • アピスmini導線分析

の精度を向上させる。

プロフィール DXジュン

DXジュン プロフィール写真 ```

筆者プロフィール|DXジュン(Apice Technology 代表)

```

「tecn」を運営している DXジュン です。
Apice Technology株式会社の代表として、20年以上にわたり Web制作・業務システム開発・業務改善支援に携わっています。

普段は中小企業向けに、在庫管理・予約管理・受発注管理など、 業務を効率化するためのシステム開発やDX支援を行っています。

tecnでは、業務改善のヒントやWebシステムの仕組み、 「技術が暮らしを少し便利で楽しくする」をテーマに、 現場目線で分かりやすく情報発信しています。

最近は在庫管理のDX化に力を入れており、 SKU・JAN・棚卸・バーコード運用など、 現場で役立つ実践的なノウハウを発信しています。

また、小規模事業者向けの無料ツール 「アピスminiシリーズ」も公開しています。

```

業務改善に役立つ無料ツールや在庫管理システムを公開しています

無料在庫管理システムを見る アピスminiシリーズを見る ```

🔗 Apice Technology(会社HP)
🔗 音を楽しむ【耳スタ】
🔗 在庫管理システムの機能紹介

記事が皆さまの仕事や日常のヒントになれば幸いです。

未分類
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
  • japanparts.com 様 データベースサーバ更改ご提案書(パイロット版)
  • AI時代の安全なシステム開発とは?~機密情報を守りながら生産性を高める開発体制の考え方~

関連記事

  • AI時代の安全なシステム開発とは?~機密情報を守りながら生産性を高める開発体制の考え方~
    2026年6月4日
  • 保護中: japanparts.com 様 データベースサーバ更改ご提案書(パイロット版)
    2026年6月3日
  • Eufy はどこの国のブランド
    Eufyはどこの国のブランドですか?|信頼できるの❓ロボット掃除機の特徴と人気モデルを解説
    2026年6月2日
  • MOVAはどこの国のメーカー
    MOVAはどこの国のメーカーですか?|会社概要・評判・人気ロボット掃除機を解説  信頼できる?【2026年最新版】
    2026年6月2日
  • Narwal はどこの国のメーカーですか
    Narwalはどこの国のメーカーですか?|ロボット掃除機の特徴と人気モデルを解説 信頼できるの?
    2026年6月2日
  • SwitchBotはどこの国のメーカーですか?|会社概要・評判・人気スマートホーム製品を解説
    2026年6月2日
  • iRobot はどこの国のメーカーですか
    iRobotはどこの国のメーカーですか?|会社概要・評判・ルンバの特徴を解説
    2026年6月1日
  • STOCKmini 3分でセットアップ 
    STOCKminiを3分でセットアップする方法|スプレッドシートをコピーしてすぐ使う手順 |在庫管理
    2026年6月1日

コメント

コメントする コメントをキャンセル

アピス在庫管理システム
アピス在庫管理導入講座

カテゴリー

  • AIに対してのプロンプト
  • Bluetoothコーデック基礎
  • Chrome ブラウザー
  • Dropbox
  • ECサイト
  • IT TOOL一覧
  • IT導入・業務効率化
  • IT導入補助金
  • LDAC-Blue
  • mini:GAS仕様 設定手順等
  • PC関連
  • SEO・ブログ改善
  • Shopify
  • STEPmini
  • webコーダー挑戦
  • Webデザイナー挑戦
  • WEB制作・開発
  • Web制作挑戦
  • Windows
  • Wordpress
  • ZOOM
  • アクセス解析
  • アピスmini
  • アピス在庫管理
  • イヤホン
  • エクセル・ワード
  • エンジニア技術MEMO
  • お知らせ
  • コーダー技術MEMO
  • コーディングメモ
  • スマートガジェット
  • セキュリティ
  • セルフオーダーシステム
  • デザインチーム
  • どこの国ブランド
  • トランプ高関税
  • ネットで販売
  • バーコード
  • ハイブリッド車(HV/PHEV)
  • ビジネス支援ツール
  • ブログ
  • ブログ収益化
  • ブログ運営
  • プロンプト
  • マーケティング・ブログ運営
  • レッスン施術サービス
  • 会議室予約
  • 充電器・バッテリー
  • 回線・インターネット
  • 在庫管理
  • 地球にやさしい車
  • 家事代行予約
  • 家電ガジェット
  • 接続&音質トラブル
  • 政治・経済
  • 日用品・家電系
  • 時事・経済・グローバル
  • 未分類
  • 業務効率化
  • 画像生成AI
  • 発注・請求システム
  • 端末別設定
  • 美容院予約
  • 見積
  • 見積
  • 請求
  • 電気自動車(EV)

最近の投稿

  • AI時代の安全なシステム開発とは?~機密情報を守りながら生産性を高める開発体制の考え方~
  • TECN内部リンク抽出GAS 仕様書 V0.2
  • 保護中: japanparts.com 様 データベースサーバ更改ご提案書(パイロット版)
  • Eufyはどこの国のブランドですか?|信頼できるの❓ロボット掃除機の特徴と人気モデルを解説
  • MOVAはどこの国のメーカーですか?|会社概要・評判・人気ロボット掃除機を解説  信頼できる?【2026年最新版】

アーカイブ

  • 2026年6月
  • 2026年5月
  • 2026年4月
  • 2026年3月
  • 2026年2月
  • 2026年1月
  • 2025年12月
  • 2025年11月
  • 2025年10月
  • 2025年9月
  • 2025年8月
  • 2025年7月
  • 2025年6月
  • 2025年5月
  • 2025年4月
  • 2025年3月
  • 2025年2月
  • 2025年1月
  • 2024年12月
  • 2024年11月
  • 2024年9月
  • 2024年8月
  • 2024年7月
  • 2024年6月
  • 2024年4月
  • 2024年3月
  • 2024年2月
  • 2024年1月
  • 2023年12月
  • 2023年11月
  • 2023年10月
  • 2023年8月
  • 2023年7月
  • 2023年6月
  • 2023年5月
  • 2023年4月
  • 2023年3月
  • 2023年2月
  • 2023年1月
  • 2022年12月
  • 2022年11月
  • 2022年10月
  • 2022年9月
  • 2022年8月
  • 2022年7月

APICE

問い合わせ

アピステクノロジー|tec note

 〒224-0032 神奈川県横浜市都筑区茅ケ崎中央42−21 第2佐藤ビル 203

電話番号: 045-532-4480

お問い合せ

© tecn.

目次