Estrarre il grassetto e il corsivo il testo da un documento di testo

0

Domanda

Ho i file di testo e io sono l'evidenziazione del testo in grassetto e corsivo. Vorrei uno script che legge il .file txt e le esportazioni di tutto il testo in grassetto o in corsivo e in un altro documento (file di testo).

Qualcuno sa un modo?

Preferibilmente R soluzione, ma può provare altre soluzioni.

Utente Mac

macos r text
2021-11-23 09:51:26
1

Migliore risposta

0

Supponiamo di avere una riduzione di file di testo formattato ìn.md e vogliamo creare un altro file markdown out.md contenente solo il corsivo e il grassetto sezioni.

Il contenuto del file.md:

# Header

There is *italic* and **bold** text!
There is *another italic* and **another bold** text!
library(tidyverse)

text <- read_file("in.md")
bold_texts <- text %>%
  str_extract_all("\\*\\*[^\\*]+\\*\\*") %>%
  purrr::simplify() %>%
  map_chr(~ .x %>% str_remove_all("\\*"))
bold_texts
#> [1] "bold"         "another bold"
italic_texts <-
  text %>%
  str_remove_all(bold_texts %>% map_chr(~ paste0("\\*\\*", .x, "\\*\\*")) %>% paste0(collapse = "|")) %>%
  str_extract_all("\\*[^\\*]+\\*") %>%
  purrr::simplify() %>%
  map_chr(~ .x %>% str_remove_all("\\*"))
italic_texts
#> [1] "italic"         "another italic"

out_text <- c("#Bold texts:", bold_texts, "#Italic texts:", italic_texts) %>% paste0(collapse = "\n")
cat(out_text)
#> #Bold texts:
#> bold
#> another bold
#> #Italic texts:
#> italic
#> another italic
write_file(out_text, "out.md")

Creato il 2021-11-23 dal reprex pacchetto (v2.0.1)

2021-11-23 14:10:33

grazie, funziona perfettamente!
GIS_newbie

In altre lingue

Questa pagina è in altre lingue

Русский
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................