Przepływy pracy transkrypcji i koszty
Usługa transkrypcji Bookshift przekształca Twoje dyktowanie audio w dopracowany, gotowy do użycia tekst — zoptymalizowany dla autorów fikcji.
Czym jest transkrypcja
Usługa transkrypcji została zaprojektowana specjalnie dla autorów fikcji, którzy:
- Dyktują swoje historie zamiast pisać
- Nagrywają sesje burzy mózgów lub pomysły na fabułę
- Chcą uchwycić pomysły podczas spaceru, jazdy samochodem lub z dala od klawiatury
Co ją wyróżnia
W odróżnieniu od ogólnych narzędzi do transkrypcji, usługa Bookshift:
- Rozumie fikcję — Rozpoznaje znaczniki dialogów, imiona postaci, narracyjny przepływ
- Stosuje korektę — Wieloetapowe czyszczenie dla przejrzystego wyniku
- Obsługuje treści dla dorosłych — Nie musisz cenzurować swojego dyktowania
- Oferuje presety ulepszania — Dopracowanie dialogów, opisów, tempa narracji
Obsługiwane formaty audio
| Format | Obsługa |
|---|---|
| MP3 | ✅ Obsługiwany |
| WAV | ✅ Obsługiwany |
| M4A | ✅ Obsługiwany |
| AAC | ✅ Obsługiwany |
| OGG | ✅ Obsługiwany |
| FLAC | ✅ Obsługiwany |
| AIFF | ✅ Obsługiwany |
Tryby transkrypcji
Tryb jednorazowy (domyślny)
Najlepszy do: Standardowych sesji dyktowania trwających do 30 minut
Jak działa:
1. Pobierz plik audio
2. Transkrybuj przy użyciu Whisper API
3. Zastosuj pierwszą rundę korekty
4. Zastosuj drugą rundę korekty
5. Zwróć gotową transkrypcję
Czas przetwarzania: Zazwyczaj 2–5 minut
Tryb fragmentowany
Najlepszy do: Dłuższych nagrań wymagających wyższej jakości
Jak działa:
1. Wstępne przetwarzanie audio (normalizacja, usuwanie ciszy, przyspieszenie)
2. Podział na łatwe do zarządzania fragmenty
3. Równoległe transkrybowanie fragmentów
4. Czyszczenie każdego fragmentu
5. Agregacja i końcowe czyszczenie
Czas przetwarzania: Dłuższy, ale wyższa jakość
Presety trybu fragmentowanego
| Preset | Przyspieszenie | Rozmiar fragmentu | Najlepszy do |
|---|---|---|---|
| conservative | 1,35x | 5 min | Ostrożne przetwarzanie |
| aggressive | 2,0x | 3 min | Szybszy czas realizacji |
| hyper | 3,0x | 2,5 min | Maksymalna szybkość |
| no_speedup | 1,0x | 4 min | Oryginalne tempo |
| chunk_only | brak | zmienne | Niestandardowe przetwarzanie |
Koszty
| Usługa | Koszt w kredytach |
|---|---|
| Transkrypcja audio | Dynamiczna wycena wyświetlana przed przesłaniem |
| Notatki robocze do pełnego konspektu (wkrótce) | Wkrótce |
Tip
Transkrypcja Bookshift jest tańsza niż jakiekolwiek porównywalne usługi, a szacunkowy koszt możesz zobaczyć przed przesłaniem.
Dodatkowe funkcje
Projekty i słowniki
Zdefiniuj kontekst dla swojej transkrypcji:
- Nazwa projektu — Pomaga AI zrozumieć Twoją pracę
- Imiona postaci — Zapewnia poprawną pisownię
- Nazwy miejsc — Spójne w całej transkrypcji
- Terminy słownikowe — Niestandardowe słowa z preferowaną pisownią
Presety ulepszania
Po transkrypcji zastosuj ukierunkowane dopracowanie:
| Preset | Co robi |
|---|---|
| dialogue | Wygładza znaczniki dialogów i wzorce mowy |
| description | Ulepsza fragmenty opisowe |
| saidisms | Urozmaica znaczniki dialogów poza „powiedział" |
| pacing | Dostosowuje rytm zdań |
Notatki robocze do pełnego konspektu (wkrótce)
Ten przepływ pracy nie jest jeszcze publicznie dostępny. Po udostępnieniu będzie przekształcać nagrane notatki robocze w ustrukturyzowany konspekt.
Wynik
Transkrypcja dostarcza:
- Czysty tekst — Gotowy do wklejenia do rękopisu
- Eksport DOCX — Opcjonalny format dokumentu Word
- Surowa transkrypcja — Nieedytowana wersja do wglądu
Ograniczenia
- Domyślnym trybem jest tryb jednorazowy (tryb fragmentowany należy wybrać ręcznie)
- Bardzo długie pliki mogą wymagać trybu fragmentowanego
- Hałas w tle może wpływać na dokładność
- Brak zwrotów w przypadku niepowodzenia transkrypcji (problemy zdarzają się rzadko)
Najlepsze praktyki
- Nagrywaj w cichym otoczeniu — Zmniejsza liczbę błędów
- Mów wyraźnie — Szczególnie w przypadku imion postaci
- Korzystaj ze słownika — Definiuj nietypowe terminy z wyprzedzeniem
- Przeglądaj i edytuj — Zawsze sprawdzaj wynik przed użyciem
- Fragmentuj długie sesje — Lepsza jakość dla nagrań powyżej 30 minut