DeepSeek-R1 kombinerer AI og Edge Computing for industriell IoT

Introduksjon

De små destillerte modellene av DeepSeek-R1 er finjustert ved hjelp av tankekjededata generert av DeepSeek-R1, merket med...tagger, som arver resonneringsmulighetene til R1. Disse finjusterte datasettene inkluderer eksplisitt resonneringsprosesser som problemdekomposisjon og mellomliggende deduksjoner. Forsterkningslæring har justert den destillerte modellens atferdsmønstre med resonneringstrinnene generert av R1. Denne destillasjonsmekanismen lar små modeller opprettholde beregningseffektivitet samtidig som de oppnår komplekse resonneringsevner nær de til større modeller, noe som er av betydelig anvendelsesverdi i ressursbegrensede scenarier. For eksempel oppnår 14B-versjonen 92 % av kodefullføringen til den originale DeepSeek-R1-modellen. Denne artikkelen introduserer den destillerte DeepSeek-R1-modellen og dens kjerneapplikasjoner innen industriell edge computing, oppsummert i følgende fire retninger, sammen med spesifikke implementeringstilfeller:

dc3c637c5bead8b62ed51b6d83ac0b4

Prediktivt vedlikehold av utstyr

Teknisk implementering

Sensorfusjon:

Integrer vibrasjons-, temperatur- og strømdata fra PLS-er via Modbus-protokollen (samplingsfrekvens 1 kHz).

Funksjonsutvinning:

Kjør Edge Impulse på Jetson Orin NX for å trekke ut 128-dimensjonale tidsseriefunksjoner.

Modellslutning:

Implementer DeepSeek-R1-Distill-14B-modellen, og legg inn funksjonsvektorer for å generere sannsynlighetsverdier for feil.

Dynamisk justering:

Utløs vedlikeholdsordrer når konfidensen er > 85 %, og start en sekundær verifiseringsprosess når den er < 60 %.

Relevant sak

Schneider Electric tok i bruk denne løsningen på gruvemaskiner, noe som reduserte andelen falske positive resultater med 63 % og vedlikeholdskostnadene med 41 %.

1

Kjører DeepSeek R1 Distilled Model på InHand AI Edge-datamaskiner

Forbedret visuell inspeksjon

Utdataarkitektur

Typisk distribusjonsrørledning:

kamera = GigE_Vision_Camera(500fps) # Gigabit industrikamera
frame = camera.capture() # Ta bilde
preprocessed = OpenCV.denoise(frame) # Støyfjerning av forbehandling
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Feilklassifisering
hvis defekttype != 'normal':
PLC.trigger_reject() # Utløser sorteringsmekanisme

Ytelsesmålinger

Behandlingsforsinkelse:

82 ms (Jetson AGX Orin)

Nøyaktighet:

Deteksjon av defekter i sprøytestøpt form når 98,7 %.

2

DeepSeek R1s implikasjoner: Vinnere og tapere i den generative AI-verdikjeden

Optimalisering av prosessflyt

Viktige teknologier

Naturlig språkinteraksjon:

Operatører beskriver utstyrsavvik via tale (f.eks. "Ekstrudertrykksvingninger ±0,3 MPa").

Multimodal resonnement:

Modellen genererer optimaliseringsforslag basert på historiske data for utstyr (f.eks. justering av skruehastigheten med 2,5 %).

Verifisering av digital tvilling:

Validering av parametersimulering på EdgeX Foundry-plattformen.

Implementeringseffekt

BASFs kjemiske fabrikk tok i bruk denne ordningen, og oppnådde en reduksjon i energiforbruket på 17 % og en økning i produktkvaliteten på 9 %.

3

Edge AI og fremtidens næringsliv: OpenAI o1 vs. DeepSeek R1 for helsevesen, bilindustri og IIoT

Øyeblikkelig henting av kunnskapsbasen

Arkitekturdesign

Lokal vektordatabase:

Bruk ChromaDB til å lagre utstyrsmanualer og prosessspesifikasjoner (innebyggingsdimensjon 768).

Hybrid henting:

Kombiner BM25-algoritmen + cosinuslikhet for spørringen.

Resultatgenerering:

R1-7B-modellen oppsummerer og forbedrer gjenfinningsresultatene.

Typisk tilfelle

Siemens-ingeniører løste inverterfeil gjennom spørringer på naturlig språk, noe som reduserte gjennomsnittlig behandlingstid med 58 %.

Utfordringer og løsninger ved distribusjon

Minnebegrensninger:

Benyttet KV Cache-kvantiseringsteknologi, noe som reduserte minnebruken til 14B-modellen fra 32 GB til 9 GB.

Sikre ytelse i sanntid:

Stabilisert enkeltinferensforsinkelse til ±15 ms gjennom CUDA Graph-optimalisering.

Modelldrift:

Ukentlige trinnvise oppdateringer (overføring av kun 2 % av parameterne).

Ekstreme miljøer:

Designet for brede temperaturområder fra -40 °C til 85 °C med IP67-beskyttelsesnivå.

5
微信图片_20240614024031.jpg1

Konklusjon

Nåværende utrullingskostnader har nå sunket til $599/node (Jetson Orin NX), med skalerbare applikasjoner som dannes i sektorer som 3C-produksjon, bilmontering og energikjemi. Kontinuerlig optimalisering av MoE-arkitekturen og kvantiseringsteknologien forventes å gjøre det mulig for 70B-modellen å kjøre på edge-enheter innen utgangen av 2025.

Finn ELV-kabelløsning

Kontrollkabler

For BMS, BUS, industri og instrumentkabel.

Strukturert kabelsystem

Nettverk og data, fiberoptisk kabel, patchledning, moduler, frontplate

Gjennomgang av utstillinger og arrangementer i 2024

16.–18. april 2024 Midtøsten-energi i Dubai

16.–18. april 2024 Securika i Moskva

9. mai 2024 LANSERING AV NYE PRODUKTER OG TEKNOLOGIER i Shanghai

22.–25. oktober 2024 SIKKERHET KINA i Beijing

19.–20. november 2024 CONNECTED WORLD KSA


Publisert: 07.02.2025